Zürcher Nachrichten - L'intoxication des données, la menace invisible qui cible les chatbots IA

EUR -
AED 4.208972
AFN 73.34913
ALL 94.723353
AMD 421.974787
ANG 2.051943
AOA 1052.100506
ARS 1662.879862
AUD 1.633057
AWG 2.065807
AZN 1.978188
BAM 1.956541
BBD 2.309234
BDT 140.740843
BGN 1.937883
BHD 0.432188
BIF 3417.034603
BMD 1.146079
BND 1.480067
BOB 7.922931
BRL 5.913075
BSD 1.146514
BTN 108.094993
BWP 15.569964
BYN 3.174316
BYR 22463.148822
BZD 2.305953
CAD 1.620569
CDF 2635.982402
CHF 0.923513
CLF 0.02623
CLP 1032.353653
CNY 7.758154
CNH 7.7801
COP 3947.164915
CRC 519.496734
CUC 1.146079
CUP 30.371094
CVE 110.539495
CZK 24.21281
DJF 203.681339
DKK 7.474578
DOP 66.988435
DZD 152.877533
EGP 57.214216
ERN 17.191185
ETB 181.542388
FJD 2.57438
FKP 0.866335
GBP 0.866304
GEL 3.042833
GGP 0.866335
GHS 12.840022
GIP 0.866335
GMD 83.095899
GNF 10056.843814
GTQ 8.738271
GYD 239.878749
HKD 8.983701
HNL 30.577569
HRK 7.533061
HTG 149.887416
HUF 352.880059
IDR 20401.352662
ILS 3.389644
IMP 0.866335
INR 108.242008
IQD 1501.363518
IRR 1576145.174428
ISK 144.211309
JEP 0.866335
JMD 181.107005
JOD 0.812568
JPY 184.84937
KES 148.30689
KGS 100.224458
KHR 4595.776869
KMF 493.960537
KPW 1031.47152
KRW 1753.283128
KWD 0.353016
KYD 0.955453
KZT 559.764426
LAK 25288.233135
LBP 102631.376141
LKR 382.424825
LRD 208.58626
LSL 18.887737
LTL 3.384074
LVL 0.693252
LYD 7.306198
MAD 10.680023
MDL 20.070688
MGA 4813.532348
MKD 61.632041
MMK 2406.219499
MNT 4102.473907
MOP 9.255865
MRU 45.900542
MUR 54.863033
MVR 17.650441
MWK 1990.739584
MXN 19.87701
MYR 4.735597
MZN 73.245837
NAD 18.887637
NGN 1559.929785
NIO 41.980445
NOK 11.119145
NPR 172.952743
NZD 1.996321
OMR 0.440665
PAB 1.146524
PEN 3.877153
PGK 5.029002
PHP 69.62545
PKR 319.010697
PLN 4.260726
PYG 6982.613861
QAR 4.174591
RON 5.239069
RSD 117.378035
RUB 84.353628
RWF 1677.286648
SAR 4.300311
SBD 9.235444
SCR 15.640758
SDG 688.219677
SEK 10.975193
SGD 1.48023
SHP 0.855664
SLE 28.365606
SLL 24032.708241
SOS 654.985307
SRD 42.827769
STD 23721.521821
STN 24.583395
SVC 10.032887
SYP 126.678518
SZL 18.898513
THB 37.636661
TJS 10.640037
TMT 4.011277
TND 3.372337
TOP 2.759484
TRY 53.229627
TTD 7.785949
TWD 36.245092
TZS 3009.085442
UAH 51.527989
UGX 4184.548182
USD 1.146079
UYU 46.07745
UZS 13237.212413
VES 695.248966
VND 30176.260636
VUV 135.976896
WST 3.153785
XAF 656.199778
XAG 0.017601
XAU 0.000275
XCD 3.097336
XCG 2.066365
XDR 0.806493
XOF 652.688901
XPF 119.331742
YER 271.764039
ZAR 18.887164
ZMK 10316.082823
ZMW 20.508588
ZWL 369.036977
  • AEX

    -3.8900

    1077.47

    -0.36%

  • BEL20

    0.0000

    5648.94

    0%

  • PX1

    -11.8600

    8456.49

    -0.14%

  • ISEQ

    -67.5500

    13719.15

    -0.49%

  • OSEBX

    19.6600

    1947.09

    +1.02%

  • PSI20

    -7.2300

    9033.56

    -0.08%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    -88.3500

    4200.66

    -2.06%

  • N150

    1.2700

    4233.94

    +0.03%

L'intoxication des données, la menace invisible qui cible les chatbots IA
L'intoxication des données, la menace invisible qui cible les chatbots IA / Photo: Nicolas TUCAT - AFP/Archives

L'intoxication des données, la menace invisible qui cible les chatbots IA

Le recours aux agents conversationnels basés sur l'intelligence artificielle occupe une place croissante dans le rapport des utilisateurs à l'information. Mais aux biais et aux erreurs des "chatbots" s'ajoute la menace de manipulation des données sur lesquels ils sont entraînés.

Taille du texte:

. L'IA, cible de choix

ChatGPT, Mistral, Claude ou Gemini... Prisés des utilisateurs pour leur rapidité et leur facilité d'utilisation, les "chatbots" IA sont entraînés à formuler leurs réponses à partir de gigantesques bases de données regroupant des milliards de documents, inlassablement compilés et archivés par des "robots" qui parcourent internet en quête de données.

Il y apprennent comment, statistiquement, les mots s'enchaînent pour former des phrases et des idées, afin de pouvoir ensuite générer des réponses cohérentes qui ont le plus de chances de correspondre à la requête de l'usager.

Mais ce mode de collecte et d'entraînement expose les "chatbots" à de possibles manipulations par des acteurs malveillants, susceptibles d'introduire dans leurs données d'entraînement des éléments indésirables comme de la désinformation, de la propagande ou du code informatique malveillant.

. Empoisonnement, conditionnement

Chercheurs au Laboratoire d'investigation numérique de l'Atlantic council, un think tank d'étude des relations internationales, Valentin Châletet et Esteban Ponce de León distinguent deux concepts:

L'empoisonnement de données des grands modèles de langage (LLM) sur lesquels reposent les chatbots ("LLM poisoning") se produit en amont, lors de l'entraînement, via l'injection d'éléments non désirés. Ces manipulations sont pensées pour contourner les mécanismes de filtrage mis en place par les entreprises pour garantir des données fiables.

Le conditionnement ("LLM grooming") intervient plus tard, alors que le chatbot est déjà déployé: des acteurs malveillants diffusent massivement du contenu en ligne pour qu'il soit intégré par les modèles IA.

Ainsi, des tests menés par l'entreprise d'analyse de la fiabilité des contenus en ligne Newsguard ont montré que, dans diverses circonstances, les principaux chabots commerciaux pouvaient répondre en s'appuyant sur de fausses informations du réseau Pravda, une nébuleuse de sites web destinés à amplifier la propagande prorusse.

Ces manipulations peuvent être difficiles à repérer et endiguer, notamment parce que le fonctionnement de ces modèles est volontairement rendu opaque par leurs concepteurs: "On a affaire à un réseau de neurones qui fonctionne comme une boîte noire", explique Valentin Châtelet.

Expurger les données en question nécessiterait le plus souvent un réentraînement complet du modèle, estime le chercheur, et présenterait "un coût extrême" en temps et en ressources. La complexité de ces systèmes algorithmiques rend également très ardus leur audit ou leur régulation.

. "Désinformation à la demande"

Le phénomène est difficile à mesurer et son impact sur les utilisateurs complexe voire impossible à démontrer. Mais, difficilement traçables et relativement peu coûteuses, ces opérations ont de quoi séduire les acteurs qui souhaiteraient promouvoir leurs narratifs, qu'il s'agisse d'Etats, de lobbies ou d'entreprises.

"Ce type d'opération pourrait être mené par un groupe industriel qui veut enterrer les résultats d'une étude médicale scientifique qui ne va pas dans leur sens, par un homme politique qui veut pousser un récit qui va servir sa campagne...", énumère Chine Labbé, rédactrice en chef française de Newsguard.

Esteban Ponce de León observe pour sa part le développement d'un écosystème de "désinformation à la demande", au sein duquel des Etats ou des entités "délègueraient (...) l'opération à une autre entité, probablement privée, qui dispose déjà de l'expertise technologique nécessaire pour mener à bien" une campagne d'influence visant les LLM.

En septembre 2025, une entreprise dirigée par l'ancien directeur de campagne de Donald Trump a ainsi reçu plusieurs millions de dollars d'entreprises liées à l'Etat israélien pour diffuser des éléments de langage favorables via un réseau de sites web, avec pour objectif notamment d'influencer les réponses des chatbots, selon le think tank américain Quincy Institute for Responsible Statecraft.

Face au risque, les entreprises d'IA sont les premières concernées: il est ainsi crucial d'"apprendre aux chatbots à distinguer et à ne pas pondérer de la même manière les sources fiables et les sources de propagande étrangère ou de désinformation", argue Chine Labbé.

D.Smith--NZN