Résumé
Le but de cette thèse est d'approfondir notre compréhension et de développer de nouvelles méthodologies pour les modèles génératifs probabilistes. Il existe de nombreux types de modèles génératifs, notamment les réseaux GAN, les auto-encodeurs variationnels et les modèles basés sur les flux. Récemment, de nouvelles méthodes basées sur des idées empruntées à la thermodynamique hors équilibre, à savoir les modèles probabilistes basés sur la diffusion, ont vu le jour : ces méthodes peuvent être étudiées sous différents angles, dont les processus de diffusion de Markov en temps discret, les équations différentielles stochastiques qui utilisent la fonction « score », ou plus généralement les méthodes de transport optimal et la résolution d'équations aux dérivées partielles de grande dimension.
Dans cette Thèse, nous visons à résoudre les difficultés exceptionnelles des modèles basés sur la diffusion, qui incluent l'efficacité de calcul pour l’entrainement et l'échantillonnage, ainsi que la qualité et la structure des échantillons générés, pour n'en nommer que quelques-uns. Un défi supplémentaire que nous considérons concerne la nature des données que nous visons à modéliser : nous visons à généraliser les modèles actuels à des espaces génériques non euclidiens.