AlphaGenome: KI-Modell sagt Funktion großer DNA-Abschnitte voraus
Google DeepMind veröffentlicht wissenschaftliche Studie zu seinem im Juni vorgestellten KI-Modell
AlphaGenome kann etliche Funktionen für sehr große Abschnitte des Erbguts vorhersagen
Experten finden die Möglichkeiten des Modells beeindruckend, für spezifische Analysen seien andere Tools aber geeigneter
Das Unternehmen Google DeepMind hat im Juni 2025 mit AlphaGenome eine neue künstliche Intelligenz (KI) zur Entschlüsselung der DNA und ihrer funktionellen Bereiche vorgestellt [I]. Die entsprechende wissenschaftliche Studie wurde im Fachjournal „Nature“ veröffentlicht (siehe Primärquelle).
Der Vorteil von AlphaGenome im Vergleich zu bereits bestehenden Modellen ist laut Autorinnen und Autoren, eine Erbgut-Sequenz von bis zu einer Million Basenpaaren auf elf unterschiedliche Eigenschaften untersuchen zu können. Es kann zum Beispiel vorhersagen, welche RNA-Abschnitte aus dem Erbgut gebildet werden und ob diese anhand der Sequenz richtig geschnitten werden. Außerdem soll es vorhersagen, welche räumliche Nähe durch die Faltung des Erbguts entstehen kann und welche genetischen Varianten aufgrund von Mutationen im Erbgut entstehen können.
Leiter der Arbeitsgruppe Computational Genome Biology, Berlin Institute of Health (BIH), Charité – Universitätsmedizin Berlin, und Professor für Regulatorische Genomik am Institut für Humangenetik, Universitätsklinikum Schleswig-Holstein, Lübeck
Mehrwert von AlphaGenome im Vergleich zu bereits bestehenden Tools
„AlphaGenome kombiniert Vorhersagen vieler funktioneller Genomik-Eigenschaften. Das sind zum Beispiel Regionen offenen Chromatins, Transkriptionsfaktorbindungen, Histonmodifikationen und Transkriptionen. Das tut es für eine Vielzahl an Zelltypen in einem einheitlichen Modell und nur aus der genomischen Sequenz selbst. Die Vorhersagen sind auf Basenpaarebene. Außerdem skaliert das Modell auf Eingabesequenzen bis zu einer Millionen Basenpaare. Dadurch können entfernte regulatorische Kontexte besser erfasst werden. Die Integration so vieler Eigenschaften über solch lange Eingabesequenzen vereinfacht integrative Bewertungen über Expression, Splicing und Chromatin hinweg. AlphaGenome ist aber nicht automatisch überlegen gegenüber spezialisierten Modellen für jede einzelne Aufgabe.“
„Die namentliche Nähe zu AlphaFold könnte hier leicht täuschen. Für Protein-kodierende Sequenzen sind AlphaFold [1] and AlphaMissense [2] weitaus bessere Modelle, um Veränderungen zu bewerten. Es handelt sich hier nicht um ein ‚universelles‘ Modell, was diese ablösen möchte.“
„Bei einer Gesamtlänge des menschlichen Genoms von etwa 3,2 Milliarden Basenpaare, ist die Eingabelänge auch nur ein Bruchteil des Genoms oder aber auch einzelner Chromosomen. Da es sich aber um ein komplexes, Parameter-reiches Modell handelt, ist es mit dieser Eingabelänge auch schon am oberen Limit aktueller Großrechnerleistung. Wir müssen davon ausgehen, dass in Zukunft effizientere Architekturen gefunden werden, welche biologisches Wissen und Konzepte besser kodieren.“
Vorteil von AlphaGenome
„Mit dem neuen Modell kann man besser simultane, multimodale Varianteneffekt-Analysen durchführen und Effekte über größere genomische Distanzen modellieren. Das erlaubt, Hypothesen zu distal regulierten Genen und kombinierten molekularen Konsequenzen aufzustellen. Diese Analysen sind auch mit anderen Modellen wie Enformer [3] oder Borzoi [4] möglich. Jetzt können sie aber mit mehr Kontext und Basenpaarauflösung in AlphaGenome durchgeführt werden.“
„Für großskalige Scans ist die Komplexität aber auch Limitierung. Das liegt daran, dass das Model nicht lokal ausgeführt werden kann, sondern über definierte programmatische Schnittstellen der Autoren (API) genutzt werden muss. Für präzise, experimentell zu validierende Fragestellungen bleiben spezialisierte Tools oft effizienter.“
Robustheit der Ergebnisse
„Prinzipiell sind die Ergebnisse robust, und die präsentierten Benchmarks zeigen solide und breite Anwendbarkeit. Für spezifische Fragenstelllungen übertreffen spezialisierte Modelle AlphaGenome in einzelnen Benchmarks. In unseren Händen sehen wir eine leichte Verbesserung in der Vorhersage genregulatorischer Effekte im Vergleich zum kleineren Enformer-Modell, welches 2021 veröffentlicht wurde. Insgesamt bleibt die Spezifität der Vorhersagen aber noch weit hinter dem, wie es beispielweise für die klinische Priorisierung genetischer Varianten nötig wäre.“
private Firma als Anbieter von AlphaGenome
„Die Konzentration großer Modelle und Recheninfrastruktur bei einer privaten Firma kann Zugang, Transparenz und Reproduzierbarkeit einschränken. Das ist aus wissenschaftlicher Sicht bedenklich. Industrielle Ressourcen ermöglichen jedoch Modelle in bisher unerreichter Skala. Offene Benchmarks, Datenfreigabe und faire Zugänge zu APIs sind deshalb entscheidend.“
Übertragbarkeit auf andere (Modell)Organismen
„Konzeptionell ist das Modell übertragbar. Aber der Erfolg hängt von verfügbaren funktionellen Trainingsdaten ab. Dieses und ähnliche Modelle basieren auf der Verwendung tausender funktioneller Datensätze und deren Abbildung zu einer Referenzsequenz. Diese Art von Daten ist im Moment für die wenigsten Modellorganismen verfügbar. Die Mechanismen, die von solchen Modellen gelernt werden, sollten jedoch zwischen Klassen übertragbar sein, zum Beispiel innerhalb der Säugetiere oder Wirbeltiere. So kann eine Anwendung auf anderen Sequenzen nutzbare Resultate bringen. Auch die Feinabstimmung eines Modells scheint praktikabel, wenn für einen Modellorganismus ein Teil der Daten vorliegt. Diese Anpassungen sind aber aufwändig und insbesondere bei der Modelkomplexität für viele Forschungsgruppen nicht praktikabel. Die Interpretation der Modelle und die Extraktion biologischer Mechanismen führt daher hoffentlich in der Zukunft zu effizienteren Architekturen und der Anwendbarkeit evolutionär-konservierter Mechanismen.“
Leiter der Abteilung Plant Genome and Systems Biology, Helmholtz Zentrum München – Deutsches Forschungszentrum für Gesundheit und Umwelt, München
Mehrwert von AlphaGenome im Vergleich zu bereits bestehenden Tools
„AlphaGenome umfasst ein breiteres Analysespektrum als bereits existierende, spezialisiertere Analysetools. In den meisten Kategorien liefert AlphaGenome bessere oder sogar deutlich bessere Ergebnisse als die existierenden Werkzeuge. Ein zweiter wesentlicher Faktor ist, dass ein ganzes Kompendium an genomisch-regulatorischen Eigenschaften (‚features‘) parallel und integriert analysiert werden. In existierenden Analysetools werden zumeist einzelnen Eigenschaften in Isolation analysiert und die Zusammenführung ist oft kompliziert und aufwendig.“
„Nach den in der Publikation dargestellten Evaluierungsdaten sind für die meisten Features von AlphaGenome etwas bessere und in Teilen deutlich bessere Performance-Daten im Vergleich zu anderen Tools zu beobachten.“
private Firma als Anbieter von AlphaGenome
„Es sollte hervorgehoben werden, dass das Training der künstlichen Intelligenz (KI) nicht ‚out of the blue‘ stattfindet. Sondern es basiert auf einem großen und robusten Datensatz, der in öffentlichen Datenbanken über die vergangenen Jahre kuratiert und verfügbar gemacht wurde. Insofern macht AlphaGenome ‚lediglich‘ Nutzen vom breiten und robusten Wissen und Datenwissen in öffentlichen Ressourcen. Ähnlich zu AlphaFold existiert jedoch eine gewisse Brüskierung des öffentlichen Forschungssektors. Solche Arbeiten hätten auch in der sogenannten ‚public domain‘ stattfinden können. Aus strukturellen Gründen wie Struktur und Mechanismen der Forschungsgruppen an Unis und Forschungszentren und förderungspolitischen Gründen und gewissen Beschränkungen beziehungsweise Gewichtung einzelner Forschungsgebiete, sind solche Arbeiten jedoch schwierig im öffentlichen Bereich durchzuführen.“
„In der Publikation sind die Datengrundlagen explizit genannt und eine Codeverfügbarkeit kommuniziert. Insofern ist AlphaGenome von Google kein kommerzieller Anbieter. Sondern es stellt sein Wissen und seine IT-Macht in den Dienst der Genomanalytik. Aber natürlich besteht die Gefahr, dass zukünftig ein genomisches Dienstleistungsunternehmen darauf aufbaut. Dies wäre jedoch auch erklärtes Ziel der Forschungspolitik, um aus im akademischen Raum entwickeltes Spezialwissen in den kommerziellen Raum zu überführen. Dass ausgerechnet ein US-Tech-Gigant wie Google solche kommerziellen Entwicklungen übernehmen würde, ist möglicherweise nicht wirklich bundesdeutsche und europäische Intention.“
Übertragbarkeit auf andere (Modell)Organismen
„Das Modell profitiert natürlich von dem breiten Datens(ch)atz, der für Menschen und Mäuse vorhanden ist. Prinzipiell sehe ich keine Limitation, die Methodik auch für andere Arten zu trainieren und anzuwenden. Dazu zählen neben medizinischen Fragestellungen auch Nutzpflanzen wie zum Beispiel Reis oder Weizen. In Teilen sind schon reiche Datensätze vorhanden, so dass eine Anwendung dort in nicht allzu ferner Zukunft möglich erscheint.“
Direktor des Instituts für Humangenetik, Universitätsklinikum Heidelberg
Mehrwert von AlphaGenome im Vergleich zu bereits bestehenden Tools
„AlphaGenome ist ein wichtiger Schritt hin zu einem einheitlichen, leistungsfähigen ‚Sequence to Function‘-Modell. Es kann insbesondere die nicht kodierenden, regulatorischen Bereiche des Genoms deutlich besser abbilden als bisherige Werkzeuge. Aus humangenetischer Sicht ist es vor allem ein Forschungswerkzeug mit hohem Potenzial für das Verständnis regulatorischer Varianten, nicht aber ein unmittelbar klinisch einsetzbares Diagnostiktool.“
private Firma als Anbieter von AlphaGenome
„Dass ein privatwirtschaftliches Unternehmen ein derart zentrales, leistungsfähiges Modell entwickelt, ist aus Sicht der Forschung ambivalent: Einerseits beschleunigt es Innovation, andererseits entstehen Abhängigkeiten von proprietären Modellen und Zugangsbedingungen. Entscheidend wird sein, inwieweit Trainingsdaten, Modellarchitektur und Schnittstellen transparent und langfristig für die akademische Forschung nutzbar bleiben, und ob sich faire, offene Standards für Evaluation, Regulierung und klinische Anwendung etablieren lassen. Für klinische Anwendungen bleibt es aus meiner Sicht unerlässlich, dass Modelle nachvollziehbar validiert, unabhängig überprüft und in einem klar regulierten Rahmen eingesetzt werden. Das gilt insbesondere bei Diagnostik und Therapieentscheidungen, unabhängig davon, ob sie aus der Industrie oder aus der akademischen Forschung stammen.“
Professor für computergestützte Molekularmedizin, Technische Universität München (TUM)
Mehrwert von AlphaGenome im Vergleich zu bereits bestehenden Tools
„AlphaGenome stellt die ‚Crème de la Crème‘ in Bezug auf sequenzbasierte Vorhersagen zur Genexpression und damit verbundene Analysen dar. Es vereint die Modellierung von 3D-Chromosomeninteraktionen mit anderen Eigenschaften, wie beispielsweise RNA-Expression, unter einem Dach. Außerdem erfolgt die Ausgabe mit einer Auflösung auf Einzelnukleotidebene (auf der Ebene einzelner Basen des Erbguts; Anm. d. Red.), während Modelle derselben Familie bisher eine Auflösung von 32 Nukleotiden hatten. Dies ist wichtig für die Modellierung der RNA-Isoform-Ergebnisse von abnormalem Spleißen (beim Ablesen der DNA wird RNA gebildet, die wiederum aus Protein-bildenden (Exons) und nicht-bildenden Abschnitten (Introns) besteht. Die Introns werden herausgeschnitten – gespleißt – bevor das Protein aus der Sequenz generiert wird; Anm. d. Red.) – einer der Hauptursachen für seltene Krankheiten, bei denen Mutationen die Funktion eines Gens zerstören können. Der Artikel weist darauf hin, dass Alphagenome erstmals über diese Vorhersagekapazität verfügt. Während frühere Modelle nur vorhersagen konnten, ob das Spleißen durch eine Variante beeinflusst werden kann, sagt AlphaGenome die Paarung zwischen Donor- und Akzeptorstellen der RNA voraus. Das kann als Grundlage für die Vorhersage dienen, ob die Proteinsequenz beeinflusst wird.“
„AlphaGenome übertrifft viele kleinere Spezialmodelle. Dennoch scheint es einige der Schwachstellen sequenzbasierter Modelle, wie die Vorhersage distaler Varianteneffekte, trotz der Einbeziehung der 3D-Faltung nicht zu lösen. Insgesamt ist AlphaGenome das neueste Beispiel einer Familie von Multitask-Modellen – zu denen auch Bassenji, Enformer und Borzoi gehören – scheint jedoch keinen qualitativen Durchbruch zu erzielen.“
„Dennoch erzielt Alpha Genome eine verbesserte Vorhersage von Varianteneffekten für Genexpression und Spleißen.“
„Darüber hinaus modelliert AlphaGenome sowohl die 3D-Chromatinorganisation als auch die Genexpression aus der Genomsequenz. Bislang wurde dies in separaten Modellen erreicht. Es hat sich jedoch herausgestellt, dass die Modellierung der Chromatinorganisation für die Vorhersage der Genexpression keinen Mehrwert bietet. Daher ist diese gemeinsame Modellierung eher für die Interpretation des Modells interessant als für ihren Mehrwert für die Vorhersage der Genexpression.“
Robustheit der Ergebnisse
„Die Ergebnisse von AlphaGenome umfassen eine breite Palette von Benchmarks mit nahezu systematischen Verbesserungen gegenüber vergleichbaren Anwendungsmodellen. Die Gesamtergebnisse sind überzeugend. Zu bedauern ist jedoch das Fehlen von Konfidenzintervallen und Fehlerbalken bei einzelnen Vergleichen.“
private Firma als Anbieter von AlphaGenome
„Ein privates Unternehmen kann Anbieter von Genomdienstleistungen sein. Ich sehe dabei folgende Probleme. Erstens: Wird DeepMind den gesamten Code und das gesamte Trainingsverfahren veröffentlichen, damit andere das Modell reproduzieren und daraus lernen können? Dies ist für den Fortschritt der Wissenschaft – des menschlichen Wissens – von grundlegender Bedeutung. In der Genomik-Community herrscht eine starke Kultur des Austauschs von Open-Source-Code und Daten (sogenannte FAIR-Prinzipien). Von der profitieren Unternehmen wie DeepMind. Es wird erwartet, dass diese Prinzipien wiederum befolgt werden. Die Community hat sich vehement gewehrt, als DeepMind versuchte, den Code von AlphaFold-3 nicht zu veröffentlichen.“
„Außerdem müssen die Parameter Im Idealfall geteilt werden, damit andere das Modell sofort nutzen können, ohne es neu trainieren zu müssen. Unternehmen können offene Software für kommerzielle Zwecke lizenzieren. Es ist erfreulich zu sehen, dass der Code von AlphaGenomes und dessen Parameter frei mit der Community geteilt werden.“
Übertragbarkeit auf andere (Modell)Organismen
„Es ist wahrscheinlich, dass dies bei allen Säugetieren ähnlich ist. Außerhalb der Säugetiere weicht der Regulationscode stärker vom menschlichen ab. Da die Daten für die meisten Arten bei weitem nicht so umfangreich sind wie für Menschen und Mäuse, sind andere Modellierungsstrategien erforderlich, um solche Modelle auf den gesamten Stammbaum des Lebens zu übertragen.“
Leitender Wissenschaftler und Interims-Leiter des European Molecular Biology Laboratory (EMBL), Heidelberg
„AlphaGenome ist ein neues Modell mit künstlicher Intelligenz (KI) zur Analyse genomischer Sequenzen. Die Bedeutung liegt weniger in einer spektakulären Lösung eines klar umrissenen Problems als in einer wichtigen methodischen Erweiterung der Möglichkeiten, regulatorische Prozesse im Genom zu interpretieren.“
Mehrwert von AlphaGenome im Vergleich zu bereits bestehenden Tools
„Im Unterschied zu AlphaFold, das die Vorhersage der Proteinstruktur als klar definiertes Problem adressierte, bewegt sich AlphaGenome in einem komplexen biologischen Kontext. Genregulation ist ein Netzwerk aus Wechselwirkungen zwischen DNA-Sequenzen, regulatorischen Elementen, Zelltypen, Entwicklungsstadien und Umweltfaktoren. Das Modell ermöglicht den Zugang zu bestimmten Teilaspekten dieses Systems. Es erzeugt keine neuen Genome, sondern sagt funktionelle Konsequenzen bestehender DNA-Sequenzen voraus.“
„Ein zentraler Fortschritt besteht in der verbesserten Vorhersage regulatorischer Effekte genetischer Varianten. AlphaGenome analysiert große DNA-Abschnitte mit hoher Auflösung und verbessert das Verständnis nicht-kodierender Genombereiche, deren regulatorische Wirkung bislang schwer vorherzusagen war.“
„Am European Bioinformatics Institute des European Molecular Biology Laboratory (EMBL-EBI) in Hinxton in Großbritannien werden große Mengen an Genomen annotiert. Das geschieht sowohl zwischen als auch innerhalb von biologischen Arten. Sequenzbasierte KI ermöglicht hier funktionelle Annotationen in großem Maßstab, auch für Organismen ohne umfassende experimentelle Daten. AlphaGenome zeigt, dass viele regulatorische Merkmale rechnergestützt vorhergesagt werden können, ohne dass für jedes Genom neue experimentelle Daten benötigt werden.“
Limitationen
„Die Grenzen sind klar: Komplexe biologische Prozesse lassen sich nur eingeschränkt mit KI abbilden. Das sind etwa Dynamiken in der Genexpression, zelltypspezifische Effekte oder Umwelteinflüsse. Dabei bleiben experimentelle Validierung und Kontextinformationen unverzichtbar.“
Übertragbarkeit auf andere (Modell)Organismen
„AlphaGenome dient vor allem als Werkzeug für die genetische Forschung. Dabei unterstützt es die Interpretation genetischer Varianten, die Generierung von Hypothesen und die Untersuchung regulatorischer Mechanismen. Die Möglichkeit, individuelle Genome zu annotieren, wird die Analyse neu sequenzierter Organismen in Zukunft beschleunigen. Außerdem eröffnet sie Anwendungen in der Humangenomik, Medizin, Biodiversitäts- und Pathogenforschung.“
private Firma als Anbieter von AlphaGenome
„Positiv ist, dass hier eine nicht-kommerzielle Lizenz und eine offene Programmierschnittstelle (API) bereitgestellt werden. Modellarchitektur und Variantenauswertung werden unter der Apache-Lizenz Open Source verfügbar sein. Das erleichtert die Wiederverwendung in der Forschung. Offen zugängliche Modelle, Gewichtungen und Trainingsdetails ermöglichen die Validierung von Ergebnissen, den fairen Methodenvergleich und den Aufbau auf bestehender Arbeit.“
„Insgesamt stellt AlphaGenome einen wichtigen Fortschritt innerhalb der Genomik dar, ohne einen paradigmatischen Umbruch zu markieren. Es verdeutlicht die zunehmende Rolle datengetriebener KI-Modelle in der Biologie und zeigt zugleich, wie komplex die Regeln der Genregulation noch sind.“
wissenschaftlicher Mitarbeiter in der Forschungsgruppe Omics Data am Institut für Bio- und Geowissenschaften (IBG-4: Bioinformatik), Forschungszentrum Jülich (FZJ), und Mitglied beim Cluster of Excellence on Plant Sciences (CEPLAS)
Mehrwert von AlphaGenome im Vergleich zu bereits bestehenden Tools
„AlphaGenome vereinheitlicht verschiedene Aufgaben in einem Modell. Dies gelingt, indem es gleichzeitig eine Million Basenpaare mit einer sehr genauen Auflösung von einem Basenpaar erfasst. Es kann trotzdem gleichzeitig hochsensitiv beispielsweise die Genregulation in verschiedenen Zelltypen, die Chromatin-Konformation oder Genvarianten allein aufgrund der DNA-Sequenz vorhersagen. Dabei kann AlphaGenome für bestimmte Aufgaben durch das sogenannte Distillation-Prinzip optimiert werden. Das ist besonders für die funktionale Beschreibung einzelner Punktmutationen nützlich, die beispielsweise häufig im Zusammenhang mit Krankheiten auftreten. Hierbei übertrifft es andere Genomikmodelle.“
„Die destillierten Modelle haben eine verbesserte Robustheit und höhere Genauigkeit bei der Vorhersage von Varianten-Effekten in einer einzigen Modellinstanz. Es ermöglicht Vorhersagen über alle modellierten Modalitäten und Zelltypen hinweg.“
„Aufgrund der Fähigkeit von AlphaGenome, einzelne Basenpaare für eine funktionelle Charakterisierung aufzulösen, eröffnen sich ebenfalls neue Möglichkeiten. Insbesondere die destillierten Modelle von AlphaGenome eignen sich nun dazu, synthetische Sequenzen mit vorhersagbaren Eigenschaften zu generieren.“
„AlphaGenome ist zudem das erste Modell, das sowohl die Vorhersage der verschiedenen Verbindungen zwischen Exons (Genabschnitt mit Informationen für Bau von Proteinen; Anm. d. Red.) eines Gens (Splice-junctions) als auch deren Häufigkeit ermöglicht. Dieser Aspekt ist besonders bedeutsam, da menschliche Gene oft aus mehreren Exons bestehen und meist alternativ gespleißt (beim Ablesen der DNA wird RNA gebildet, die wiederum aus Protein-bildenden (Exons) und nicht-bildenden Abschnitten (Introns) besteht. Die Introns werden herausgeschnitten – gespleißt – bevor das Protein aus der Sequenz generiert wird; Anm. d. Red.) werden können.“
Robustheit der Ergebnisse
„AlphaGenome steigert Stabilität und Präzision von Vorhersagen innerhalb des Trainingsbereichs, ist aber im Gegensatz zu ‚Large Genomic Models‘ wie Evo2 ein überwachter ‚Sequence-to-Function‘-Ansatz. AlphaGenome berücksichtigt keine evolutionäre Konservierung., Das ist ein wichtiger Indikator für Robustheit. Daher schlagen die Autoren vor, Vorhersagen mit Konservierung von genetischen Regionen zu kombinieren, um die Schädlichkeit von Mutationen robust abzubilden.“
private Firma als Anbieter von AlphaGenome
„Die enorme Leistungsfähigkeit des Modells wird auf dem Grafikprozessor NVIDIA H100 demonstriert. Das ist eine Hardware, die aufgrund hoher Kosten und Verknappung zunehmend schwer zugänglich ist. Dies birgt die Gefahr, dass Spitzenforschung von der Infrastruktur privater Unternehmen abhängig wird. Allerdings zeigt gerade auch das Beispiel AlphaFold (Nobelpreis Chemie 2024), wie sehr die öffentliche Forschung von den Durchbrüchen Google DeepMinds profitieren kann, wenn diese geteilt werden. Auch für AlphaGenome scheint dafür der Weg geebnet zu werden. Immerhin plant DeepMind, Quellcode, Modellgewichte und eine ‚Interpretation Suite‘ zu veröffentlichen. Ohnehin wären die destillierten Modelle deutlich schmaler als andere bereits bestehende Sprachmodelle (LLMs).“
Übertragbarkeit auf andere (Modell)Organismen
„Anders als reine DNA-Sprachmodelle wie Evo2, die Muster aus der rohen Sequenz diverser Spezies lernen, kann AlphaGenome nur bedingt auf eine neue Spezies angewendet werden, ohne neu trainiert oder fein abgestimmt zu werden. Da keine Cross-Species-Validierung gegen nicht-trainierte Spezies stattgefunden hat, ist unklar, ob die erfassten molekularen Mechanismen universell sind. Diese Cross-Validierung ist aber auch nur möglich, solange für andere Spezies genügend hochqualitative Datensätze vorliegen. Das ist mit vielleicht der Ausnahme von der Fruchtfliege und der Ackerschmalwand überhaupt nicht der Fall. Gerade in Bereichen wie der Pflanzenforschung wäre der Einsatz solcher ‚Sequence-to-Function‘-Genommodelle von besonders großem Nutzen, könnten diese über Artgrenzen hinweg angewandt werden, etwa bei Weizen, Gerste oder Reis. Die Züchtung neuer Varianten mit vorteilhaften Eigenschaften nimmt derzeit noch Jahre in Anspruch.“
„Es bestehen keine Interessenkonflikte.“
„Kein Interessenkonflikt von meiner Seite.“
„Ich habe keine Interessenkonflikte.“
„Ich habe keinen Interessenkonflikt gegenüber meinen Angaben und Antworten.“
Alle anderen: Keine Angaben erhalten
Primärquelle
Avsec Ž et al. (2026): Advancing regulatory variant effect prediction with AlphaGenome. Nature. DOI: 10.1038/s41586-025-10014.0.
Literaturstellen, die von den Expert:innen zitiert wurden
[1] Jumper J et al. (2021): Highly accurate protein structure prediction with AlphaFold. Nature. DOI: 10.1038/s41586-021-03819-2.
[2] Cheng J et al. (2023): Accurate proteome-wide missense variant effect prediction with AlphaMissense. Science. DOI: 10.1126/science.adg7492.
[3] Avsec Ž et al. (2021): Effective gene expression prediction from sequence by integrating long-range interactions. Nature Methods. DOI: 10.1038/s41592-021-01252-x.
[4] Linder J et al. (2025): Predicting RNA-seq coverage from DNA sequence as a unifying model of gene regulation. Nature Genetics. DOI: 10.1038/s41588-024-02053-6.
Literaturstellen, die vom SMC zitiert wurden
[I] Avsec Ž et al. (25.06.2025): AlphaGenome: AI for better understanding the genome. Pressemitteilung von Google DeepMind.
Prof. Dr. Martin Kircher
Leiter der Arbeitsgruppe Computational Genome Biology, Berlin Institute of Health (BIH), Charité – Universitätsmedizin Berlin, und Professor für Regulatorische Genomik am Institut für Humangenetik, Universitätsklinikum Schleswig-Holstein, Lübeck
Angaben zu möglichen Interessenkonflikten
„Es bestehen keine Interessenkonflikte.“
Prof Dr. Klaus Mayer
Leiter der Abteilung Plant Genome and Systems Biology, Helmholtz Zentrum München – Deutsches Forschungszentrum für Gesundheit und Umwelt, München
Angaben zu möglichen Interessenkonflikten
„Kein Interessenkonflikt von meiner Seite.“
Prof. Dr. Christian Schaaf
Direktor des Instituts für Humangenetik, Universitätsklinikum Heidelberg
Prof. Dr. Julien Gagneur
Professor für computergestützte Molekularmedizin, Technische Universität München (TUM)
Angaben zu möglichen Interessenkonflikten
„Ich habe keine Interessenkonflikte.“
Dr. Jan Korbel
Leitender Wissenschaftler und Interims-Leiter des European Molecular Biology Laboratory (EMBL), Heidelberg
Dr. Simon Maria Zumkeller
wissenschaftlicher Mitarbeiter in der Forschungsgruppe Omics Data am Institut für Bio- und Geowissenschaften (IBG-4: Bioinformatik), Forschungszentrum Jülich (FZJ), und Mitglied beim Cluster of Excellence on Plant Sciences (CEPLAS)
Angaben zu möglichen Interessenkonflikten
„Ich habe keinen Interessenkonflikt gegenüber meinen Angaben und Antworten.“