L'intelligence artificielle déverrouille de nouveaux mystères biologiques

Quand l’IA surpasse les méthodes traditionnelles en biologie

Depuis quelques années, la biologie bénéficie d’avancées majeures grâce aux outils issus de l’intelligence artificielle. Parmi eux, AlphaFold, développé par DeepMind (Google), a révolutionné le domaine en prédisant la structure tridimensionnelle des protéines simplement à partir de leur séquence. Son adoption massive par la communauté scientifique mondiale témoigne de son utilité.
Cependant, AlphaFold reste dépendant de données de séquences fiables. Lorsqu’un échantillon est inconnu ou dégradé, son efficacité chute : sans correspondance avec une base de données existante, l’algorithme ne peut générer aucune prédiction utile.

Heureusement, la recherche a progressé. Une nouvelle vague d’algorithmes n’essaie plus de comparer des fragments connus, mais de deviner ce qui est totalement inédit. En abandonnant la simple reconnaissance, ces modèles ouvrent une porte sur des territoires biologiques jusque-là inaccessibles.

Déchiffrer la complexité des protéines grâce à l’IA

En biologie, l’ADN est souvent désigné comme la base du vivant, mais c’est en réalité la protéine qui en est le véritable acteur. Chaque gène peut produire une immense variété de protéines, transformées par d’innombrables processus chimiques. Cartographier cet univers est d’une complexité extrême : les « protéoformes », c’est-à-dire les différentes formes qu’une même protéine peut prendre, sont presque infinies.

Traditionnellement, les chercheurs utilisaient la spectrométrie de masse pour identifier les protéines. Cette technique consiste à fragmenter les protéines en peptides et à comparer leur masse aux bases de données. Toutefois, ce procédé reste très limité : environ 70 % des peptides observés n’ont aucune correspondance connue.

Timothy Patrick Jenkins, chercheur à la Technical University of Denmark, résume parfaitement ce problème :

« La protéomique traditionnelle, c’est un peu comme faire une recherche sur Google : si l’information n’est pas répertoriée, vous ne la trouverez pas. »

Pour surmonter cet obstacle, l’IA entre en scène. À l’image de Casanovo, développé par William Noble et son équipe de l’Université de Washington, certains modèles n’essaient plus de reconnaître, mais de prédire. Casanovo utilise des réseaux neuronaux pour déduire l’agencement le plus probable des peptides, même en l’absence de correspondance explicite.

Un parallèle avec la compréhension du langage naturel

Pour mieux saisir cette approche, imaginez écrire une phrase bancale comme « tapis le chat sur dort ». Un système comme ChatGPT réorganiserait cette phrase en « le chat dort sur le tapis » pour lui donner du sens. Casanovo opère de manière similaire, reconstruisant la structure la plus cohérente d’une protéine à partir d’éléments apparemment désordonnés.

InstaNova : l’enquêteur moléculaire de nouvelle génération

Un autre modèle, InstaNova, développé par Jenkins et ses collègues européens, utilise une technique innovante inspirée des générateurs d’images par IA : la diffusion. L’idée est de perturber les données en leur ajoutant du « bruit » pour forcer le système à mieux comprendre l’essence même de l’information.

Cette approche a porté ses fruits. Testé sur un échantillon complexe issu de neuf organismes différents, InstaNova+ (version avancée d’InstaNova) a permis d’identifier 42 % de peptides supplémentaires par rapport aux méthodes traditionnelles.

Des résultats spectaculaires en applications médicales

Lorsqu’il a été appliqué à des échantillons de plaies infectées, InstaNova a détecté 1 225 peptides uniques associés à l’albumine — une protéine clé du plasma sanguin — contre seulement une centaine avec les techniques classiques. Plus impressionnant encore, 254 de ces peptides n’avaient jamais été observés auparavant. InstaNova a également permis de rattacher des peptides à 52 protéines bactériennes spécifiques, une prouesse jusqu’ici hors de portée.

Catrine Soiberg, responsable R&D chez Atlas Antibodies, souligne :

« InstaNova est capable de traiter des échantillons extrêmement complexes et de fournir des résultats exploitables. »

Une percée également en archéologie

La puissance de ces outils ne se limite pas à la biologie médicale. Matthew Collins, chercheur à Cambridge, utilise InstaNova pour étudier des échantillons archéologiques : ossements, poteries, tous altérés par les siècles. L’analyse des protéines résiduelles, quasiment impossible autrefois, devient désormais une réalité grâce à ces IA.

« Ces outils sont si efficaces que nous avons entièrement réorienté notre travail autour d’eux », confie Collins.

Une révolution silencieuse pour la recherche scientifique

Progressivement, l’intelligence artificielle repousse les limites de la biologie classique. Là où l’identification des protéines devenait incertaine, l’IA ouvre désormais de nouvelles perspectives, rendant visibles des séquences jusqu’alors invisibles.

Loin de remplacer les biologistes, l’IA devient leur alliée. Elle prolonge la capacité humaine d’observer, d’analyser et de comprendre. En élargissant ce que nous sommes capables de voir, elle redéfinit également ce que nous pouvons chercher — et donc ce que nous pouvons découvrir.
Un nouveau moteur du progrès scientifique est en marche.