Dec 11, 2023
Machine
Nature Computational Science volume 3, pages 334-345 (2023)Citer cet article 8339 Accès 8 Citations 44 Détails de Altmetric Metrics Auto-organisation moléculaire pilotée par plusieurs corps concertés
Nature Computational Science volume 3, pages 334-345 (2023)Citer cet article
8339 Accès
8 citations
44 Altmétrique
Détails des métriques
L'auto-organisation moléculaire pilotée par des interactions concertées à plusieurs corps produit les structures ordonnées qui définissent à la fois la matière inanimée et vivante. Nous présentons ici un algorithme d'échantillonnage de chemin autonome qui intègre l'apprentissage profond et la théorie des chemins de transition pour découvrir le mécanisme des phénomènes d'auto-organisation moléculaire. L'algorithme utilise le résultat des trajectoires nouvellement initiées pour construire, valider et, si nécessaire, mettre à jour des modèles mécanistes quantitatifs. Clôturant le cycle d'apprentissage, les modèles guident l'échantillonnage pour améliorer l'échantillonnage d'événements d'assemblage rares. La régression symbolique condense le mécanisme appris sous une forme interprétable par l'homme en termes d'observables physiques pertinents. Appliqués à l'association d'ions en solution, à la formation de cristaux d'hydrates de gaz, au repliement des polymères et à l'assemblage membrane-protéine, nous capturons les mouvements du solvant à plusieurs corps régissant le processus d'assemblage, identifions les variables de la théorie classique de la nucléation, découvrons le mécanisme de repliement à différents niveaux de résolution et révéler des voies d’assemblage concurrentes. Les descriptions mécanistiques sont transférables à travers les états thermodynamiques et l’espace chimique.
Comprendre comment des interactions génériques mais subtilement orchestrées coopèrent dans la formation de structures complexes est la clé pour piloter l’auto-assemblage moléculaire1,2. En tant qu'expériences informatiques, les simulations de dynamique moléculaire (MD) nous promettent des vues atomiquement détaillées et impartiales des processus d'auto-organisation3. Cependant, la plupart des processus d’auto-organisation collective sont des événements rares qui se produisent sur des échelles de temps bien plus longues que les mouvements moléculaires rapides limitant l’étape d’intégration MD. Le système passe la plupart du temps dans des états métastables, et les transitions stochastiques rares et rapides entre les états sont rarement résolues dans les simulations MD impartiales, voire pas du tout. Ces chemins de transition (TP) sont des segments de trajectoire très particuliers qui capturent le processus de réorganisation. L’apprentissage des mécanismes moléculaires à partir de simulations nécessite que la puissance de calcul soit concentrée sur l’échantillonnage des TP4 et sur la distillation de modèles quantitatifs à partir de ceux-ci5. En raison de la grande dimensionnalité de l’espace de configuration, l’échantillonnage et l’extraction d’informations sont extrêmement difficiles en pratique. Notre algorithme répond à ces deux défis à la fois. Il construit de manière autonome et simultanée des modèles mécanistiques quantitatifs d'événements moléculaires complexes, valide les modèles à la volée et les utilise pour accélérer l'échantillonnage de plusieurs ordres de grandeur par rapport au MD classique.
La mécanique statistique fournit un cadre général pour obtenir des modèles mécanistes de faible dimension d'événements d'auto-organisation. Dans cet article, nous nous concentrons sur les systèmes qui se réorganisent entre deux États A et B (respectivement assemblés ou désassemblés), mais la généralisation à un nombre arbitraire d’États est simple. Chaque TP reliant les deux états contient une séquence d'instantanés capturant le système lors de sa réorganisation. Par conséquent, l’ensemble de chemins de transition (TPE) est le mécanisme à la résolution la plus élevée. La transition étant effectivement stochastique, la quantification de son mécanisme nécessite un cadre probabiliste. Nous définissons le committor pS(x) comme la probabilité qu'une trajectoire entre en premier dans l'état S, avec S = A ou B, respectivement, où x est un vecteur de caractéristiques représentant le point de départ X dans l'espace de configuration, et pA(x) + pB(x) = 1 pour la dynamique ergodique. Le committor pB rend compte de la progression de la réaction A → B et prédit le devenir de la trajectoire de manière markovienne6,7, ce qui en fait la coordonnée de réaction idéale8,9. Dans le jeu d'échecs, on peut considérer le commit comme la probabilité que, par exemple, les noirs gagnent pour des positions initiales données sur l'échiquier dans des parties répétées10. Les exigences minimales pour les applications au-delà des simulations moléculaires sont (1) qu'il existe une quantité semblable à un commit et (2) que la dynamique du système peut être échantillonnée à plusieurs reprises, au moins dans le sens direct. La probabilité de différents événements possibles (A, B, …) devrait donc être codée au moins en partie (et donc apprenable en termes de) l'état instantané X du système et la dynamique du système devrait se prêter à un échantillonnage répété, de préférence par une simulation informatique efficace. Cependant, si l’on peut préparer de manière répétée un système réel avec un contrôle satisfaisant sur les conditions initiales, on peut apprendre à prédire le sort probable de ce système étant donné les conditions initiales observées et contrôlées en utilisant notre cadre.