Zürcher Nachrichten - Un pas de plus dans l'interprétation du génome grâce à l'IA

EUR -
AED 4.231245
AFN 73.725097
ALL 95.962768
AMD 434.735824
ANG 2.062095
AOA 1056.342299
ARS 1606.393999
AUD 1.626239
AWG 2.073519
AZN 1.957604
BAM 1.95412
BBD 2.323522
BDT 141.558314
BGN 1.969047
BHD 0.434928
BIF 3421.305633
BMD 1.151955
BND 1.473031
BOB 7.97187
BRL 5.995001
BSD 1.153668
BTN 106.985319
BWP 15.644465
BYN 3.516233
BYR 22578.31327
BZD 2.320215
CAD 1.578374
CDF 2614.937616
CHF 0.909578
CLF 0.026702
CLP 1054.361214
CNY 7.917443
CNH 7.932522
COP 4269.950704
CRC 538.818112
CUC 1.151955
CUP 30.526801
CVE 111.797223
CZK 24.444653
DJF 204.725614
DKK 7.472483
DOP 69.175247
DZD 152.537418
EGP 60.177999
ERN 17.279321
ETB 180.856753
FJD 2.548643
FKP 0.863331
GBP 0.863321
GEL 3.127603
GGP 0.863331
GHS 12.562006
GIP 0.863331
GMD 85.244374
GNF 10114.162901
GTQ 8.837288
GYD 241.357858
HKD 9.029004
HNL 30.607446
HRK 7.53747
HTG 151.189535
HUF 391.62372
IDR 19539.456616
ILS 3.571117
IMP 0.863331
INR 106.993323
IQD 1509.060734
IRR 1514820.507162
ISK 143.2575
JEP 0.863331
JMD 181.144285
JOD 0.81669
JPY 183.535768
KES 149.235866
KGS 100.738475
KHR 4619.338365
KMF 493.036529
KPW 1036.734401
KRW 1729.129827
KWD 0.353005
KYD 0.961307
KZT 556.522279
LAK 24709.429743
LBP 103157.548449
LKR 359.231198
LRD 211.211295
LSL 19.376215
LTL 3.401423
LVL 0.696806
LYD 7.349679
MAD 10.798136
MDL 20.113313
MGA 4803.651589
MKD 61.677112
MMK 2419.224151
MNT 4113.747641
MOP 9.313507
MRU 46.21601
MUR 53.577753
MVR 17.809319
MWK 1999.793406
MXN 20.387203
MYR 4.51048
MZN 73.611468
NAD 19.375558
NGN 1563.13347
NIO 42.300018
NOK 11.020803
NPR 171.170971
NZD 1.970788
OMR 0.442921
PAB 1.153663
PEN 3.948325
PGK 4.956574
PHP 68.866739
PKR 321.735508
PLN 4.267705
PYG 7456.072821
QAR 4.197681
RON 5.092557
RSD 117.454429
RUB 96.613944
RWF 1680.701993
SAR 4.325527
SBD 9.267752
SCR 16.230038
SDG 692.324942
SEK 10.747156
SGD 1.473891
SHP 0.864264
SLE 28.395712
SLL 24155.927782
SOS 658.342883
SRD 43.054339
STD 23843.137717
STN 24.767027
SVC 10.094191
SYP 127.389792
SZL 19.375564
THB 37.565572
TJS 11.034248
TMT 4.031842
TND 3.360832
TOP 2.77363
TRY 50.935521
TTD 7.820006
TWD 36.757731
TZS 2999.3791
UAH 50.735507
UGX 4340.193737
USD 1.151955
UYU 46.719839
UZS 14025.049287
VES 519.46575
VND 30307.9297
VUV 137.765566
WST 3.149103
XAF 655.348139
XAG 0.015
XAU 0.000236
XCD 3.113216
XCG 2.079141
XDR 0.814294
XOF 652.58393
XPF 119.331742
YER 274.827596
ZAR 19.358311
ZMK 10368.954649
ZMW 22.559726
ZWL 370.928962
  • AEX

    -12.8600

    999.98

    -1.27%

  • BEL20

    -37.7200

    5129.08

    -0.73%

  • PX1

    -4.7800

    7969.88

    -0.06%

  • ISEQ

    117.6200

    12369.92

    +0.96%

  • OSEBX

    13.6100

    1986.11

    +0.69%

  • PSI20

    -40.3700

    9134.62

    -0.44%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    -88.6400

    3699.3

    -2.34%

  • N150

    9.7200

    3898.6

    +0.25%

Un pas de plus dans l'interprétation du génome grâce à l'IA
Un pas de plus dans l'interprétation du génome grâce à l'IA / Photo: HO - AFP/Archives

Un pas de plus dans l'interprétation du génome grâce à l'IA

AlphaGenome, outil d'intelligence artificielle (IA) de Google rendu public mercredi, fait un pas de plus dans la compréhension du génome, en analysant comment des portions de l'ADN régulent l'activité des gènes dans la cellule.

Taille du texte:

Le déchiffrage de l'ensemble du génome humain en 2003, "nous a donné le livre de la vie, mais le lire reste un défi", a rappelé Pushmeet Kohli, vice-président de la recherche chez Google DeepMind, à l'occasion de la présentation d'AlphaGenome dans la revue Nature.

"Nous avons le texte" - la succession de 3 milliards de paires de nucléotides A, T, C et G qui composent l'ADN -, mais "comprendre la grammaire (...) et la manière dont cela gouverne la vie constitue la prochaine frontière majeure de la recherche", a-t-il souligné devant la presse.

Seules 2% des séquences d'ADN "codent" directement des protéines, indispensables au fonctionnement des organismes vivants.

Les 98% restants ont un rôle de "chef d'orchestre": elles coordonnent, protègent et régulent l'expression de l'information génétique dans chacune de nos cellules. Ces séquences, appelées "non codantes", contiennent de nombreux variants associés à des maladies.

Ce sont elles qu'étudie AlphaGenome, venant compléter les autres modèles développés par le laboratoire d'IA de Google: AlphaMissense (analyse des séquences codantes de l'ADN), AlphaProteo (conception de protéines) et AlphaFold (prédiction de la structure de protéines, prix Nobel de chimie en 2024).

Le modèle d'apprentissage profond (dans lequel un réseau de neurones apprend à reconnaître automatiquement des motifs complexes) a été entraîné avec des données provenant de grands consortiums publics, qui ont mesuré expérimentalement ces propriétés dans des centaines de types de cellules et de tissus chez l'homme et la souris.

Il est capable d'analyser une longue séquence d'ADN et de "prédire" l'influence de chaque paire de nucléotides sur différents processus biologiques dans la cellule: activer ou réprimer l'expression d'un gène, piloter l'assemblage de l'ARN (une "copie" de l'ADN qui transmet l'information génétique dans la cellule)...

- "Fondamental" mais "pas parfait" -

D'autres modèles existaient déjà. Mais ils devaient faire un compromis entre la longueur des séquences analysées et la finesse de la résolution.

Or, une longue séquence - jusqu'à un million de paires de nucléotides - est "nécessaire pour comprendre l'environnement régulateur complet d'un gène unique", explique Ziga Avsec, un des co-auteurs du projet.

Et la finesse de la résolution permet d'étudier l'effet de variants génétiques en comparant les prédictions de séquences mutées à celles de séquences non mutées.

Autre avancée, AlphaGenome modélise simultanément l'influence de la séquence sur onze processus biologiques, alors que les scientifiques devaient jusqu'à présent utiliser plusieurs modèles.

Cet outil "peut accélérer notre compréhension du génome en aidant à cartographier l'emplacement des éléments fonctionnels et à déterminer leurs rôles au niveau moléculaire", estime Natasha Latysheva, également co-autrice.

"Nous espérons que les chercheurs enrichiront avec davantage de données et de modalités" le modèle, déjà testé par 3.000 scientifiques de 160 pays et désormais disponible en open source pour la recherche non-commerciale, souligne M. Kohli.

"Identifier précisément les différences dans nos génomes qui nous rendent plus ou moins susceptibles de développer des milliers de maladies est une étape clé vers de meilleurs traitements", note Ben Lehner, responsable de la génomique générative et synthétique au Wellcome Sanger Institute de Cambridge.

Le chercheur, qui n'a pas participé au projet mais a testé le modèle, le juge "très performant", mais encore "loin d'être parfait".

"Les modèles d'IA ne sont bons que dans la mesure où les données utilisées pour les entraîner le sont", or la plupart des jeux de données existants "sont trop petits et insuffisamment standardisés", explique-t-il dans une réaction à l'organisme britannique Science Media Center (SMC).

AlphaGenome n'est pas une "solution miracle à toutes les questions biologiques", l'expression des gènes "étant influencée par des facteurs environnementaux complexes", mais il constitue un "outil fondamental", abonde Robert Goldstone, responsable de la génomique au Francis Crick Institute, cité dans le même texte.

Selon lui, ce nouvel outil permettra aux scientifiques "d'étudier et de simuler de manière programmatique les bases génétiques des maladies complexes".

X.Blaser--NZN