Un système d’intelligence artificielle (IA) est capable de générer des protéines originales à partir de rien. Cette technologie pourrait révolutionner le domaine de l’ingénierie des protéines en accélérant le développement de nouvelles protéines utilisables pour diverses applications, allant des thérapies médicales à la dégradation des plastiques.
Des scientifiques ont créé un système d’IA capable de générer des enzymes artificielles à partir de rien. Lors de tests en laboratoire, certaines de ces enzymes ont fonctionné aussi bien que celles trouvées dans la nature, même lorsque leurs séquences d’acides aminés générées artificiellement divergeaient considérablement de toute protéine naturelle connue.
Les scientifiques ont créé un système d’IA capable de générer des enzymes artificielles à partir de rien. Lors de tests en laboratoire, certaines de ces enzymes ont fonctionné aussi bien que celles trouvées dans la nature, même lorsque leurs séquences d’acides aminés générées artificiellement divergeaient considérablement de toute protéine naturelle connue.
L’expérience montre que le traitement du langage naturel, bien qu’il ait été développé pour lire et écrire du texte, peut apprendre au moins certains des principes fondamentaux de la biologie. Salesforce Research a développé le programme d’IA, appelé ProGen, qui utilise la prédiction du prochain élément pour assembler des séquences d’acides aminés en protéines artificielles.
Les scientifiques ont déclaré que cette nouvelle technologie pourrait devenir plus puissante que l’évolution dirigée, la technologie de conception de protéines lauréate du prix Nobel, et qu’elle stimulera le domaine de l’ingénierie des protéines, vieux de 50 ans, en accélérant le développement de nouvelles protéines utilisables pour presque tout, des thérapies à la dégradation des plastiques.
« Les conceptions artificielles fonctionnent beaucoup mieux que les conceptions inspirées du processus évolutif », a déclaré James Fraser, PhD, professeur de bio-ingénierie et de sciences thérapeutiques à la UCSF School of Pharmacy, et co-auteur de l’étude, publiée le 26 janvier dans Nature Biotechnology.
« Le modèle de langage apprend des aspects de l’évolution, mais c’est différent du processus évolutif normal », a déclaré Fraser. « Nous avons maintenant la possibilité d’ajuster la génération de ces propriétés pour des effets spécifiques. Par exemple, une enzyme qui est incroyablement thermostable ou qui préfère les environnements acides ou qui n’interagit pas avec d’autres protéines. »
Pour créer le modèle, les scientifiques ont simplement introduit les séquences d’acides aminés de 280 millions de protéines différentes dans le modèle d’apprentissage automatique et l’ont laissé digérer les informations pendant quelques semaines. Ensuite, ils ont affiné le modèle en l’amorçant avec 56 000 séquences de cinq familles de lysozymes, ainsi que des informations contextuelles sur ces protéines.
Le modèle a rapidement généré un million de séquences, et l’équipe de recherche en a sélectionné 100 à tester, en fonction de leur ressemblance avec les séquences de protéines naturelles, ainsi que de la naturalité de la « grammaire » et des « sémantiques » des acides aminés sous-jacents des protéines d’IA.
Parmi ce premier lot de 100 protéines, qui ont été criblées in vitro par Tierra Biosciences, l’équipe a créé cinq protéines artificielles à tester dans des cellules et a comparé leur activité à une enzyme présente dans le blanc d’œuf de poule, appelée lysozyme de blanc d’œuf de poule (HEWL). Des lysozymes similaires se trouvent dans les larmes, la salive et le lait humain, où ils protègent contre les bactéries et les champignons.
Deux des enzymes artificielles ont réussi à décomposer les parois cellulaires des bactéries avec une activité comparable à celle du HEWL, bien que leurs séquences ne soient identiques qu’à environ 18 % l’une à l’autre. Les deux séquences étaient environ 90 % et 70 % identiques à toute protéine connue.
Une seule mutation dans une protéine naturelle peut la rendre inopérante, mais lors d’un autre cycle de criblage, l’équipe a découvert que les enzymes générées par l’IA montraient une activité même lorsque seulement 31,4 % de leur séquence ressemblaient à une protéine naturelle connue.
L’IA a même été capable d’apprendre comment les enzymes devraient être formées, simplement en étudiant les données de séquence brute. Mesurées par cristallographie aux rayons X, les structures atomiques des protéines artificielles étaient conformes à ce qu’elles devraient être, bien que les séquences soient différentes de tout ce qui a été observé auparavant.
Salesforce Research a développé ProGen en 2020, en se basant sur un type de programmation en langage naturel que leurs chercheurs avaient initialement développé pour générer du texte en anglais.
Ils savaient, grâce à leurs travaux antérieurs, que le système d’IA pouvait apprendre par lui-même la grammaire et le sens des mots, ainsi que d’autres règles sous-jacentes pour rédiger un texte bien composé.
« Lorsque vous entraînez des modèles basés sur des séquences avec beaucoup de données, ils sont vraiment puissants pour apprendre la structure et les règles », a déclaré Nikhil Naik, PhD, directeur de la recherche en IA chez Salesforce Research, et auteur principal de l’article. « Ils apprennent quels mots peuvent coexister et aussi la compositionnalité. »
Avec les protéines, les choix de conception étaient presque illimités. Les lysozymes sont de petite taille pour des protéines, avec jusqu’à environ 300 acides aminés. Cependant, avec 20 acides aminés possibles, il existe un nombre énorme (20^300) de combinaisons possibles. Cela représente un nombre plus grand que l’ensemble des êtres humains ayant vécu à travers le temps, multiplié par le nombre de grains de sable sur Terre, multiplié par le nombre d’atomes dans l’univers.
Étant donné les possibilités illimitées, il est remarquable que le modèle puisse générer si facilement des enzymes fonctionnelles.
« La capacité de générer des protéines fonctionnelles à partir de rien dès la sortie de la boîte démontre que nous entrons dans une nouvelle ère de la conception des protéines », a déclaré Ali Madani, PhD, fondateur de Profluent Bio, ancien chercheur chez Salesforce Research et premier auteur de l’article. « C’est un nouvel outil polyvalent à la disposition des ingénieurs en protéines, et nous avons hâte de voir les applications thérapeutiques. »
–
SEO INSIDE est une agence conseil SEO (notamment…).
--
SEO Inside est une agence web et SEO - en savoir plus sur nous:
Agence web / Audit SEO / Conseil SEO / Création de site internet / Refonte de site internet optimisé pour le SEO / Référencement naturel / Référencement local /Netlinking / Formation SEO / E-Réputation et avis
Voici nos implantations :
Lille / Dunkerque / Amiens – ce sont nos 3 bureaux historiques.
Puis voici nos zones géographiques d’intervention :
Paris / Abbeville / Rouen / Compiègne / Reims / Metz / Caen / Evreux / Nancy / Colmar / Rennes / Le Mans / Orléans / Dijon / Besançon / Angers / Nantes / La Rochelle / Poitiers / Limoges /Clermont-Ferrand / Lyon / Annecy / Grenoble / Valence / Bordeaux / Montauban / Toulouse / Biarritz / Montpellier / Marseille / Cannes / Nice / Avignon / Monaco
SEO INSIDE est une agence web spécialiste en référencement naturel qui se veut proche de vous. Contactez-nous pour discuter de vos projets.