Zürcher Nachrichten - Pour grandir, l'IA générative se tourne vers les livres

EUR -
AED 4.301716
AFN 77.102387
ALL 96.616471
AMD 443.59572
ANG 2.096746
AOA 1074.110656
ARS 1684.073797
AUD 1.758993
AWG 2.108396
AZN 1.969468
BAM 1.957105
BBD 2.345093
BDT 142.274846
BGN 1.956007
BHD 0.441553
BIF 3442.853937
BMD 1.171331
BND 1.509332
BOB 8.045363
BRL 6.406593
BSD 1.164301
BTN 104.676122
BWP 15.509538
BYN 3.38224
BYR 22958.084827
BZD 2.341701
CAD 1.616097
CDF 2613.239193
CHF 0.932854
CLF 0.027423
CLP 1075.808999
CNY 8.274988
CNH 8.264125
COP 4497.758224
CRC 573.294418
CUC 1.171331
CUP 31.040268
CVE 110.338556
CZK 24.254104
DJF 207.332642
DKK 7.469173
DOP 74.991593
DZD 152.193302
EGP 55.679188
ERN 17.569963
ETB 181.362875
FJD 2.661028
FKP 0.878173
GBP 0.875095
GEL 3.150162
GGP 0.878173
GHS 13.36591
GIP 0.878173
GMD 86.093306
GNF 10127.924632
GTQ 8.912942
GYD 243.592389
HKD 9.11565
HNL 30.667099
HRK 7.533972
HTG 152.464242
HUF 384.781097
IDR 19525.616879
ILS 3.760118
IMP 0.878173
INR 105.789742
IQD 1525.229804
IRR 49342.312982
ISK 148.653646
JEP 0.878173
JMD 186.706858
JOD 0.830471
JPY 182.433563
KES 151.043402
KGS 102.432364
KHR 4665.189668
KMF 494.301362
KPW 1054.231935
KRW 1724.076032
KWD 0.359305
KYD 0.970243
KZT 603.629828
LAK 25249.724748
LBP 104262.760889
LKR 359.538149
LRD 205.499626
LSL 19.790509
LTL 3.458635
LVL 0.708527
LYD 6.336359
MAD 10.761174
MDL 19.82213
MGA 5198.532133
MKD 61.550841
MMK 2459.697828
MNT 4154.37601
MOP 9.332201
MRU 46.432945
MUR 53.96325
MVR 18.043867
MWK 2018.971787
MXN 21.296909
MYR 4.814311
MZN 74.859436
NAD 19.790509
NGN 1696.918251
NIO 42.849297
NOK 11.831326
NPR 167.483226
NZD 2.014724
OMR 0.450386
PAB 1.164276
PEN 3.91441
PGK 4.940378
PHP 69.135453
PKR 329.125834
PLN 4.227977
PYG 7933.458103
QAR 4.244229
RON 5.090017
RSD 117.381377
RUB 92.827568
RWF 1694.651428
SAR 4.395478
SBD 9.640746
SCR 16.086003
SDG 704.554117
SEK 10.833077
SGD 1.515035
SHP 0.878802
SLE 28.228883
SLL 24562.220258
SOS 664.251324
SRD 45.233288
STD 24244.183864
STN 24.516763
SVC 10.187748
SYP 12951.233403
SZL 19.783611
THB 37.189173
TJS 10.769872
TMT 4.111371
TND 3.422281
TOP 2.820284
TRY 49.900805
TTD 7.89523
TWD 36.561336
TZS 2881.45984
UAH 49.291291
UGX 4156.771079
USD 1.171331
UYU 45.630419
UZS 13975.25684
VES 301.742191
VND 30838.213177
VUV 143.479984
WST 3.256414
XAF 656.402992
XAG 0.018862
XAU 0.000278
XCD 3.16558
XCG 2.098417
XDR 0.816355
XOF 656.4086
XPF 119.331742
YER 279.391668
ZAR 19.827656
ZMK 10543.376279
ZMW 27.076397
ZWL 377.168059
  • AEX

    4.6200

    948.39

    +0.49%

  • BEL20

    4.9900

    4993.86

    +0.1%

  • PX1

    74.6100

    8097.69

    +0.93%

  • ISEQ

    155.4100

    12894.27

    +1.22%

  • OSEBX

    12.7000

    1641.11

    +0.78%

  • PSI20

    -7.2200

    8011.47

    -0.09%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    76.8700

    4395.43

    +1.78%

  • N150

    23.4900

    3694.44

    +0.64%

Pour grandir, l'IA générative se tourne vers les livres
Pour grandir, l'IA générative se tourne vers les livres / Photo: Kirill KUDRYAVTSEV - AFP/Archives

Pour grandir, l'IA générative se tourne vers les livres

Préserver les droits d'auteurs en négociant avec les plateformes: confronté aux besoins toujours plus grands de l'intelligence artificielle générative, le monde de l'édition commence lui aussi à passer des contrats avec ses acteurs pour monnayer ses contenus.

Taille du texte:

Le grand éditeur américain HarperCollins vient de proposer à certains de ses auteurs un contrat avec une société d'intelligence artificielle (IA) - dont l'identité est confidentielle - permettant à cette dernière d'utiliser leurs œuvres publiées pour entraîner son modèle d'intelligence artificielle générative.

Dans un courrier consulté par l'AFP, l'entreprise d'IA propose 2.500 dollars par livre sélectionné afin d'entraîner son modèle de langage (LLM) pour une période de trois ans.

Car pour pouvoir produire toutes sortes de contenus sur simple requête en langage courant, les modèles d'IA générative ont besoin d'être nourris d'une quantité de données sans cesse croissante.

Contacté, l'éditeur a confirmé l'opération. "HarperCollins a conclu un accord avec une société de technologie d'intelligence artificielle pour autoriser l'utilisation limitée de certains titres (...) pour entraîner des modèles d'IA, afin d'améliorer la qualité et les performances des modèles", écrit-il.

La maison d'édition explique également que l'accord "encadre clairement la production de modèles respectueux des droits d'auteur".

L'offre a toutefois été diversement appréciée dans le secteur de l'édition, et des écrivains comme l'Américain Daniel Kibblesmith l'ont sèchement déclinée: "je le ferais probablement pour un milliard de dollars. Je le ferais pour une somme d'argent qui ne me demanderait plus de travailler, puisque c'est le but final de cette technologie", s'est indigné l'auteur sur le réseau social Bluesky.

- Nouveaux matériaux -

Si HarperCollins est l'un des plus gros éditeurs à ce jour à passer ce type d'accord, il n'est pas le premier. L'éditeur américain de livres scientifiques Wiley a donné accès "au contenu de livres académiques et professionnels publiés pour une utilisation spécifique dans la formation des modèles, pour 23 millions de dollars, à une grande entreprise technologique", indiquait-il en mars cette année, lors de la présentation de ses résultats financiers.

Ce type de collaboration met en lumière les problèmes liés au développement des intelligences artificielles génératives, qui sont entraînées sur d'immenses quantités de données collectées sur le web avec, à la clef, de potentielles violations des droit d'auteurs.

Pour Giada Pistilli, responsable de l'éthique chez Hugging Face, une plateforme d'IA en accès libre franco-américaine, cette annonce est un pas en avant, puisque le contenu des livres est monétisé. Mais elle regrette une marge de négociation limitée pour les auteurs.

"Ce que l'on va voir, c'est un mécanisme d'accords bilatéraux entre entreprises de nouvelles technologies et éditeurs ou détenteurs de droits d'auteur, alors qu'il faudrait, à mon sens, une conversation plus large pour inclure un peu plus les parties prenantes", dit-elle.

"On part de tellement loin", commente de son côté Julien Chouraqui, le directeur juridique du syndicat français de l'édition (SNE). "C'est un progrès: le fait qu'il y ait un accord signifie qu'il y a eu un dialogue et une volonté d'aboutir à un équilibre entre l'utilisation de données sources, qui sont sous droit et qui vont générer de la valeur", dit-il.

Face à ces questions, les éditeurs de presse sont eux aussi en train de s'organiser. Fin 2023, le quotidien américain The New York Times a lancé des poursuites à l'encontre d'OpenAI, créateur du logiciel ChatGPT, ainsi que de Microsoft, son principal investisseur, pour violation des droits d'auteur. D'autres médias ont, eux, noué des accords avec OpenAI.

Les entreprises de la tech n'ont peut-être plus le choix pour améliorer leurs produits que de mettre la main au portefeuille, d'autant qu'elles commencent à manquer de nouveaux matériaux pour alimenter les modèles.

La presse américaine a récemment rapporté que les nouveaux modèles en développement semblent avoir atteint leurs limites, notamment chez Google, Anthropic et OpenAI.

"Sur le net, vous récoltez du licite et de l'illicite, et beaucoup de contenus piratés. Cela pose un problème juridique. Sans oublier le problème de qualité des données", observe Julien Chouraqui, du SNE: "si on a à cœur le développement d'un marché sur des bases vertueuses, il faut donc associer l'ensemble des acteurs."

N.Zaugg--NZN