Zürcher Nachrichten - Un pas de plus dans l'interprétation du génome grâce à l'IA

EUR -
AED 4.33068
AFN 75.469752
ALL 95.373151
AMD 434.277746
ANG 2.110664
AOA 1082.522302
ARS 1649.3201
AUD 1.625387
AWG 2.125541
AZN 1.995362
BAM 1.95525
BBD 2.368733
BDT 144.309375
BGN 1.967056
BHD 0.444075
BIF 3500.514569
BMD 1.179218
BND 1.49128
BOB 8.126712
BRL 5.795969
BSD 1.176069
BTN 111.059736
BWP 15.789555
BYN 3.323564
BYR 23112.673547
BZD 2.365334
CAD 1.60922
CDF 2670.92815
CHF 0.915964
CLF 0.026705
CLP 1050.534264
CNY 8.019567
CNH 8.014278
COP 4394.962773
CRC 540.647802
CUC 1.179218
CUP 31.249278
CVE 110.233968
CZK 24.335173
DJF 209.431043
DKK 7.476713
DOP 69.940311
DZD 156.042073
EGP 62.197491
ERN 17.688271
ETB 183.635605
FJD 2.5742
FKP 0.865141
GBP 0.864688
GEL 3.15439
GGP 0.865141
GHS 13.24827
GIP 0.865141
GMD 86.695397
GNF 10319.09507
GTQ 8.979472
GYD 246.070729
HKD 9.236463
HNL 31.265199
HRK 7.539087
HTG 153.976654
HUF 353.989694
IDR 20491.802496
ILS 3.421264
IMP 0.865141
INR 111.348251
IQD 1540.666287
IRR 1546544.457081
ISK 143.876452
JEP 0.865141
JMD 185.35782
JOD 0.83607
JPY 184.706847
KES 151.887242
KGS 103.087829
KHR 4718.671646
KMF 492.91338
KPW 1061.295931
KRW 1723.792866
KWD 0.362798
KYD 0.980124
KZT 543.556983
LAK 25791.739363
LBP 105318.051896
LKR 378.643408
LRD 215.809247
LSL 19.294268
LTL 3.481924
LVL 0.713297
LYD 7.436906
MAD 10.756172
MDL 20.111338
MGA 4912.617048
MKD 61.617654
MMK 2475.701034
MNT 4221.724801
MOP 9.482631
MRU 47.007767
MUR 55.210619
MVR 18.164382
MWK 2038.926022
MXN 20.468904
MYR 4.62374
MZN 75.363639
NAD 19.294268
NGN 1609.632307
NIO 43.277817
NOK 10.859773
NPR 177.695977
NZD 1.984381
OMR 0.453622
PAB 1.176069
PEN 4.066255
PGK 5.193538
PHP 71.360333
PKR 327.773928
PLN 4.23982
PYG 7183.977637
QAR 4.29879
RON 5.219576
RSD 117.336968
RUB 87.545155
RWF 1724.114644
SAR 4.442688
SBD 9.456659
SCR 17.540162
SDG 708.118256
SEK 10.86732
SGD 1.503385
SHP 0.880405
SLE 29.067335
SLL 24727.608129
SOS 672.110794
SRD 44.101584
STD 24407.432557
STN 24.493105
SVC 10.291103
SYP 130.399137
SZL 19.281572
THB 37.974336
TJS 10.972811
TMT 4.127263
TND 3.416038
TOP 2.839274
TRY 53.474588
TTD 7.970756
TWD 36.928418
TZS 3063.737527
UAH 51.660757
UGX 4406.759452
USD 1.179218
UYU 46.906795
UZS 14265.98398
VES 588.70806
VND 31022.868147
VUV 138.279547
WST 3.192258
XAF 655.772393
XAG 0.014675
XAU 0.00025
XCD 3.186895
XCG 2.119603
XDR 0.81557
XOF 655.772393
XPF 119.331742
YER 281.390924
ZAR 19.327106
ZMK 10614.362644
ZMW 22.390697
ZWL 379.707727
  • AEX

    -1.9400

    1017.5

    -0.19%

  • BEL20

    -6.5600

    5463.32

    -0.12%

  • PX1

    -89.4000

    8112.57

    -1.09%

  • ISEQ

    -222.6400

    12721.67

    -1.72%

  • OSEBX

    -8.9100

    1970.28

    -0.45%

  • PSI20

    -66.6800

    9067.26

    -0.73%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    -6.0000

    3992.65

    -0.15%

  • N150

    -9.6600

    4189.18

    -0.23%

Un pas de plus dans l'interprétation du génome grâce à l'IA
Un pas de plus dans l'interprétation du génome grâce à l'IA / Photo: HO - AFP/Archives

Un pas de plus dans l'interprétation du génome grâce à l'IA

AlphaGenome, outil d'intelligence artificielle (IA) de Google rendu public mercredi, fait un pas de plus dans la compréhension du génome, en analysant comment des portions de l'ADN régulent l'activité des gènes dans la cellule.

Taille du texte:

Le déchiffrage de l'ensemble du génome humain en 2003, "nous a donné le livre de la vie, mais le lire reste un défi", a rappelé Pushmeet Kohli, vice-président de la recherche chez Google DeepMind, à l'occasion de la présentation d'AlphaGenome dans la revue Nature.

"Nous avons le texte" - la succession de 3 milliards de paires de nucléotides A, T, C et G qui composent l'ADN -, mais "comprendre la grammaire (...) et la manière dont cela gouverne la vie constitue la prochaine frontière majeure de la recherche", a-t-il souligné devant la presse.

Seules 2% des séquences d'ADN "codent" directement des protéines, indispensables au fonctionnement des organismes vivants.

Les 98% restants ont un rôle de "chef d'orchestre": elles coordonnent, protègent et régulent l'expression de l'information génétique dans chacune de nos cellules. Ces séquences, appelées "non codantes", contiennent de nombreux variants associés à des maladies.

Ce sont elles qu'étudie AlphaGenome, venant compléter les autres modèles développés par le laboratoire d'IA de Google: AlphaMissense (analyse des séquences codantes de l'ADN), AlphaProteo (conception de protéines) et AlphaFold (prédiction de la structure de protéines, prix Nobel de chimie en 2024).

Le modèle d'apprentissage profond (dans lequel un réseau de neurones apprend à reconnaître automatiquement des motifs complexes) a été entraîné avec des données provenant de grands consortiums publics, qui ont mesuré expérimentalement ces propriétés dans des centaines de types de cellules et de tissus chez l'homme et la souris.

Il est capable d'analyser une longue séquence d'ADN et de "prédire" l'influence de chaque paire de nucléotides sur différents processus biologiques dans la cellule: activer ou réprimer l'expression d'un gène, piloter l'assemblage de l'ARN (une "copie" de l'ADN qui transmet l'information génétique dans la cellule)...

- "Fondamental" mais "pas parfait" -

D'autres modèles existaient déjà. Mais ils devaient faire un compromis entre la longueur des séquences analysées et la finesse de la résolution.

Or, une longue séquence - jusqu'à un million de paires de nucléotides - est "nécessaire pour comprendre l'environnement régulateur complet d'un gène unique", explique Ziga Avsec, un des co-auteurs du projet.

Et la finesse de la résolution permet d'étudier l'effet de variants génétiques en comparant les prédictions de séquences mutées à celles de séquences non mutées.

Autre avancée, AlphaGenome modélise simultanément l'influence de la séquence sur onze processus biologiques, alors que les scientifiques devaient jusqu'à présent utiliser plusieurs modèles.

Cet outil "peut accélérer notre compréhension du génome en aidant à cartographier l'emplacement des éléments fonctionnels et à déterminer leurs rôles au niveau moléculaire", estime Natasha Latysheva, également co-autrice.

"Nous espérons que les chercheurs enrichiront avec davantage de données et de modalités" le modèle, déjà testé par 3.000 scientifiques de 160 pays et désormais disponible en open source pour la recherche non-commerciale, souligne M. Kohli.

"Identifier précisément les différences dans nos génomes qui nous rendent plus ou moins susceptibles de développer des milliers de maladies est une étape clé vers de meilleurs traitements", note Ben Lehner, responsable de la génomique générative et synthétique au Wellcome Sanger Institute de Cambridge.

Le chercheur, qui n'a pas participé au projet mais a testé le modèle, le juge "très performant", mais encore "loin d'être parfait".

"Les modèles d'IA ne sont bons que dans la mesure où les données utilisées pour les entraîner le sont", or la plupart des jeux de données existants "sont trop petits et insuffisamment standardisés", explique-t-il dans une réaction à l'organisme britannique Science Media Center (SMC).

AlphaGenome n'est pas une "solution miracle à toutes les questions biologiques", l'expression des gènes "étant influencée par des facteurs environnementaux complexes", mais il constitue un "outil fondamental", abonde Robert Goldstone, responsable de la génomique au Francis Crick Institute, cité dans le même texte.

Selon lui, ce nouvel outil permettra aux scientifiques "d'étudier et de simuler de manière programmatique les bases génétiques des maladies complexes".

X.Blaser--NZN