Zürcher Nachrichten - Pour grandir, l'IA générative se tourne vers les livres

EUR -
AED 4.296525
AFN 74.874664
ALL 95.983925
AMD 433.927327
ANG 2.09402
AOA 1073.986263
ARS 1629.105392
AUD 1.629005
AWG 2.105854
AZN 1.991712
BAM 1.955473
BBD 2.356632
BDT 143.595337
BGN 1.951544
BHD 0.442226
BIF 3496.56957
BMD 1.169919
BND 1.49265
BOB 8.115641
BRL 5.809352
BSD 1.170069
BTN 111.224372
BWP 15.88334
BYN 3.309646
BYR 22930.413655
BZD 2.353706
CAD 1.592827
CDF 2714.212348
CHF 0.917357
CLF 0.026787
CLP 1054.261312
CNY 7.988499
CNH 7.98712
COP 4278.686497
CRC 532.008626
CUC 1.169919
CUP 31.002855
CVE 110.246536
CZK 24.392052
DJF 208.405097
DKK 7.472384
DOP 69.594365
DZD 155.030644
EGP 62.64893
ERN 17.548786
ETB 182.743994
FJD 2.570193
FKP 0.86132
GBP 0.863675
GEL 3.135592
GGP 0.86132
GHS 13.101806
GIP 0.86132
GMD 85.403651
GNF 10269.236238
GTQ 8.942706
GYD 244.809
HKD 9.164087
HNL 31.104543
HRK 7.536735
HTG 153.133594
HUF 363.328314
IDR 20367.120986
ILS 3.464602
IMP 0.86132
INR 111.326749
IQD 1532.835385
IRR 1537273.650606
ISK 143.864961
JEP 0.86132
JMD 184.339127
JOD 0.829443
JPY 183.836985
KES 151.142186
KGS 102.274909
KHR 4694.213821
KMF 491.365838
KPW 1052.927155
KRW 1722.144058
KWD 0.36044
KYD 0.975237
KZT 542.81909
LAK 25712.693684
LBP 104801.847973
LKR 373.914181
LRD 214.754033
LSL 19.570191
LTL 3.454467
LVL 0.707673
LYD 7.409727
MAD 10.815289
MDL 20.146626
MGA 4875.183513
MKD 61.638112
MMK 2456.537262
MNT 4184.420886
MOP 9.442119
MRU 46.765968
MUR 54.705322
MVR 18.08107
MWK 2029.360126
MXN 20.46323
MYR 4.624737
MZN 74.758461
NAD 19.574122
NGN 1608.90779
NIO 43.054141
NOK 10.82684
NPR 177.956914
NZD 1.987546
OMR 0.449841
PAB 1.170304
PEN 4.104088
PGK 5.089148
PHP 72.211499
PKR 326.072492
PLN 4.256522
PYG 7274.781632
QAR 4.265767
RON 5.198072
RSD 117.406093
RUB 88.385862
RWF 1711.113426
SAR 4.389765
SBD 9.408618
SCR 16.211749
SDG 702.533879
SEK 10.834363
SGD 1.492653
SHP 0.873463
SLE 28.782244
SLL 24532.613328
SOS 668.779419
SRD 43.822825
STD 24214.962568
STN 24.490979
SVC 10.240241
SYP 129.305286
SZL 19.569722
THB 38.17508
TJS 10.954165
TMT 4.100566
TND 3.40513
TOP 2.816885
TRY 52.881418
TTD 7.948669
TWD 37.013835
TZS 3038.869425
UAH 51.564764
UGX 4391.382448
USD 1.169919
UYU 47.132106
UZS 14040.648497
VES 572.02345
VND 30815.083187
VUV 138.961562
WST 3.176551
XAF 655.84716
XAG 0.015893
XAU 0.000256
XCD 3.161765
XCG 2.109247
XDR 0.813831
XOF 655.84716
XPF 119.331742
YER 279.148142
ZAR 19.567423
ZMK 10530.689331
ZMW 21.91433
ZWL 376.713461
  • AEX

    -4.0600

    1010.03

    -0.4%

  • BEL20

    10.1700

    5363.04

    +0.19%

  • PX1

    -86.8300

    8027.99

    -1.07%

  • ISEQ

    167.7500

    12593.36

    +1.35%

  • OSEBX

    11.5100

    2030.03

    +0.57%

  • PSI20

    -169.1400

    9175.82

    -1.81%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    71.6400

    3902.45

    +1.87%

  • N150

    12.0500

    4166.18

    +0.29%

Pour grandir, l'IA générative se tourne vers les livres
Pour grandir, l'IA générative se tourne vers les livres / Photo: Kirill KUDRYAVTSEV - AFP/Archives

Pour grandir, l'IA générative se tourne vers les livres

Préserver les droits d'auteurs en négociant avec les plateformes: confronté aux besoins toujours plus grands de l'intelligence artificielle générative, le monde de l'édition commence lui aussi à passer des contrats avec ses acteurs pour monnayer ses contenus.

Taille du texte:

Le grand éditeur américain HarperCollins vient de proposer à certains de ses auteurs un contrat avec une société d'intelligence artificielle (IA) - dont l'identité est confidentielle - permettant à cette dernière d'utiliser leurs œuvres publiées pour entraîner son modèle d'intelligence artificielle générative.

Dans un courrier consulté par l'AFP, l'entreprise d'IA propose 2.500 dollars par livre sélectionné afin d'entraîner son modèle de langage (LLM) pour une période de trois ans.

Car pour pouvoir produire toutes sortes de contenus sur simple requête en langage courant, les modèles d'IA générative ont besoin d'être nourris d'une quantité de données sans cesse croissante.

Contacté, l'éditeur a confirmé l'opération. "HarperCollins a conclu un accord avec une société de technologie d'intelligence artificielle pour autoriser l'utilisation limitée de certains titres (...) pour entraîner des modèles d'IA, afin d'améliorer la qualité et les performances des modèles", écrit-il.

La maison d'édition explique également que l'accord "encadre clairement la production de modèles respectueux des droits d'auteur".

L'offre a toutefois été diversement appréciée dans le secteur de l'édition, et des écrivains comme l'Américain Daniel Kibblesmith l'ont sèchement déclinée: "je le ferais probablement pour un milliard de dollars. Je le ferais pour une somme d'argent qui ne me demanderait plus de travailler, puisque c'est le but final de cette technologie", s'est indigné l'auteur sur le réseau social Bluesky.

- Nouveaux matériaux -

Si HarperCollins est l'un des plus gros éditeurs à ce jour à passer ce type d'accord, il n'est pas le premier. L'éditeur américain de livres scientifiques Wiley a donné accès "au contenu de livres académiques et professionnels publiés pour une utilisation spécifique dans la formation des modèles, pour 23 millions de dollars, à une grande entreprise technologique", indiquait-il en mars cette année, lors de la présentation de ses résultats financiers.

Ce type de collaboration met en lumière les problèmes liés au développement des intelligences artificielles génératives, qui sont entraînées sur d'immenses quantités de données collectées sur le web avec, à la clef, de potentielles violations des droit d'auteurs.

Pour Giada Pistilli, responsable de l'éthique chez Hugging Face, une plateforme d'IA en accès libre franco-américaine, cette annonce est un pas en avant, puisque le contenu des livres est monétisé. Mais elle regrette une marge de négociation limitée pour les auteurs.

"Ce que l'on va voir, c'est un mécanisme d'accords bilatéraux entre entreprises de nouvelles technologies et éditeurs ou détenteurs de droits d'auteur, alors qu'il faudrait, à mon sens, une conversation plus large pour inclure un peu plus les parties prenantes", dit-elle.

"On part de tellement loin", commente de son côté Julien Chouraqui, le directeur juridique du syndicat français de l'édition (SNE). "C'est un progrès: le fait qu'il y ait un accord signifie qu'il y a eu un dialogue et une volonté d'aboutir à un équilibre entre l'utilisation de données sources, qui sont sous droit et qui vont générer de la valeur", dit-il.

Face à ces questions, les éditeurs de presse sont eux aussi en train de s'organiser. Fin 2023, le quotidien américain The New York Times a lancé des poursuites à l'encontre d'OpenAI, créateur du logiciel ChatGPT, ainsi que de Microsoft, son principal investisseur, pour violation des droits d'auteur. D'autres médias ont, eux, noué des accords avec OpenAI.

Les entreprises de la tech n'ont peut-être plus le choix pour améliorer leurs produits que de mettre la main au portefeuille, d'autant qu'elles commencent à manquer de nouveaux matériaux pour alimenter les modèles.

La presse américaine a récemment rapporté que les nouveaux modèles en développement semblent avoir atteint leurs limites, notamment chez Google, Anthropic et OpenAI.

"Sur le net, vous récoltez du licite et de l'illicite, et beaucoup de contenus piratés. Cela pose un problème juridique. Sans oublier le problème de qualité des données", observe Julien Chouraqui, du SNE: "si on a à cœur le développement d'un marché sur des bases vertueuses, il faut donc associer l'ensemble des acteurs."

N.Zaugg--NZN