NVIDIA und Evozyne entwickeln generatives KI-Modell für Proteine
Aufklärung über Eigenpositionen: Diese Aktien aus dem Artikel halten TraderFox-Redakteure aktuell
Mit Hilfe eines vortrainierten KI-Modells von NVIDIA hat das Start-up-Unternehmen Evozyne zwei Proteine mit großem Potenzial für das Gesundheitswesen und saubere Energien entwickelt. Ein Mitte Januar 2022 veröffentlichtes gemeinsames Papier beschreibt den Prozess und die dabei entstandenen biologischen Bausteine. Eines der Proteine zielt auf die Heilung einer angeborenen Krankheit ab, das andere soll Kohlendioxid verbrauchen, um die globale Erwärmung zu reduzieren. Die ersten Ergebnisse zeigen einen neuen Weg zur Beschleunigung der Arzneimittelentdeckung und vieles mehr.
Ein transformatorisches KI-Modell
Evozyne verwendete die NVIDIA-Implementierung von ProtT5, einem Transformationsmodell, das Teil von NVIDIA BioNeMo ist, einem Software-Framework und Service zur Erstellung von KI-Modellen für das Gesundheitswesen.
"BioNeMo bot uns wirklich alles, was wir brauchten, um das Modelltraining zu unterstützen und dann Jobs mit dem Modell sehr kostengünstig auszuführen - wir konnten Millionen von Sequenzen in nur wenigen Sekunden generieren", sagte Ferguson, ein Molekularingenieur, der an der Schnittstelle zwischen Chemie und maschinellem Lernen arbeitet. Das Modell ist das Herzstück des ProT-VAE genannten Prozesses von Evozyne. Dabei handelt es sich um einen Arbeitsablauf, der BioNeMo mit einem Variations-Autoencoder kombiniert, der als Filter fungiert. "Die Verwendung von großen Sprachmodellen in Kombination mit Variations-Auto-Encodern zum Design von Proteinen war vor ein paar Jahren noch nicht auf dem Radar", sagt er.
Modell lernt die Wege der Natur
Vergleichbar mit einem Studenten, der ein Buch liest, liest NVIDIAs Transformer-Modell die Aminosäuresequenzen von Millionen von Proteinen. Mithilfe der gleichen Techniken, die neuronale Netze zum Verstehen von Texten einsetzen, lernte es, wie die Natur diese mächtigen Bausteine der Biologie zusammensetzt.
Das Modell hat in Folge vorhergesagt, wie neue Proteine zusammengesetzt werden können, die für die von Evozyne angestrebten Funktionen geeignet sind.
Ein Meer von Möglichkeiten
Das maschinelle Lernen hilft bei der Navigation durch die astronomische Anzahl möglicher Proteinsequenzen und identifiziert dann effizient die nützlichsten Sequenzen. Die herkömmliche Methode zur Entwicklung von Proteinen, die so genannte gerichtete Evolution, verwendet einen langsamen Ansatz, bei dem es nur darauf ankommt, ob man etwas findet oder nicht. Dabei werden in der Regel jeweils nur einige wenige Aminosäuren in der Sequenz geändert. Im Gegensatz dazu kann der Ansatz von Evozyne die Hälfte oder mehr der Aminosäuren in einem Protein in einer einzigen Runde verändern. Das entspricht der Durchführung von Hunderten von Mutationen.
Mit Hilfe des neuen Verfahrens will Evozyne eine Reihe von Proteinen zur Bekämpfung von Krankheiten und des Klimawandels entwickeln.