Zürcher Nachrichten - L'avenir incertain de la lecture humaine dans le livre audio

EUR -
AED 4.211486
AFN 73.392602
ALL 95.511641
AMD 432.776502
ANG 2.052798
AOA 1051.580464
ARS 1599.186668
AUD 1.62941
AWG 2.06417
AZN 1.950449
BAM 1.94531
BBD 2.313047
BDT 140.920119
BGN 1.960169
BHD 0.433004
BIF 3405.881169
BMD 1.146761
BND 1.466391
BOB 7.93593
BRL 6.036436
BSD 1.148467
BTN 106.502991
BWP 15.573934
BYN 3.500381
BYR 22476.522195
BZD 2.309755
CAD 1.574022
CDF 2603.148425
CHF 0.908642
CLF 0.026592
CLP 1050.009345
CNY 7.881748
CNH 7.906334
COP 4249.966319
CRC 536.388929
CUC 1.146761
CUP 30.389175
CVE 111.292911
CZK 24.477592
DJF 203.802596
DKK 7.472515
DOP 68.8632
DZD 152.083519
EGP 60.016896
ERN 17.20142
ETB 180.041818
FJD 2.547878
FKP 0.859439
GBP 0.864108
GEL 3.113471
GGP 0.859439
GHS 12.505443
GIP 0.859439
GMD 84.860476
GNF 10068.564133
GTQ 8.797447
GYD 240.269731
HKD 8.987852
HNL 30.46977
HRK 7.532964
HTG 150.507919
HUF 393.566201
IDR 19547.579065
ILS 3.555017
IMP 0.859439
INR 106.869957
IQD 1502.257351
IRR 1507991.1572
ISK 143.184423
JEP 0.859439
JMD 180.327622
JOD 0.81304
JPY 183.209461
KES 148.56283
KGS 100.284227
KHR 4598.51312
KMF 490.81355
KPW 1032.060433
KRW 1720.520044
KWD 0.351666
KYD 0.956973
KZT 554.013278
LAK 24598.030854
LBP 102677.599768
LKR 357.611656
LRD 210.258849
LSL 19.288459
LTL 3.386088
LVL 0.693664
LYD 7.316422
MAD 10.749454
MDL 20.022635
MGA 4781.995185
MKD 61.659536
MMK 2408.317428
MNT 4095.201402
MOP 9.271518
MRU 46.007743
MUR 53.336139
MVR 17.728851
MWK 1990.777689
MXN 20.463899
MYR 4.513082
MZN 73.288912
NAD 19.28872
NGN 1554.469271
NIO 42.10929
NOK 11.010216
NPR 170.399271
NZD 1.976713
OMR 0.440915
PAB 1.148462
PEN 3.930523
PGK 4.934227
PHP 68.56507
PKR 320.28889
PLN 4.274375
PYG 7422.45819
QAR 4.178814
RON 5.091961
RSD 117.46143
RUB 96.189227
RWF 1673.12479
SAR 4.305733
SBD 9.22597
SCR 16.555096
SDG 689.203537
SEK 10.783811
SGD 1.471255
SHP 0.860368
SLE 28.266974
SLL 24047.024259
SOS 655.374556
SRD 42.860185
STD 23735.644363
STN 24.655369
SVC 10.048683
SYP 126.815474
SZL 19.288658
THB 37.601954
TJS 10.984502
TMT 4.013665
TND 3.345673
TOP 2.761126
TRY 50.819993
TTD 7.784751
TWD 36.749342
TZS 2985.856443
UAH 50.506773
UGX 4320.626598
USD 1.146761
UYU 46.509209
UZS 13961.819533
VES 517.123814
VND 30171.290762
VUV 137.14447
WST 3.134906
XAF 652.393596
XAG 0.015051
XAU 0.000237
XCD 3.09918
XCG 2.069767
XDR 0.810623
XOF 649.567364
XPF 119.331742
YER 273.588579
ZAR 19.457332
ZMK 10322.223659
ZMW 22.458019
ZWL 369.256682
  • AEX

    -12.8600

    999.98

    -1.27%

  • BEL20

    -37.7200

    5129.08

    -0.73%

  • PX1

    -4.7800

    7969.88

    -0.06%

  • ISEQ

    117.6200

    12369.92

    +0.96%

  • OSEBX

    13.6100

    1986.11

    +0.69%

  • PSI20

    -40.3700

    9134.62

    -0.44%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    -88.6400

    3699.3

    -2.34%

  • N150

    9.7200

    3898.6

    +0.25%

L'avenir incertain de la lecture humaine dans le livre audio
L'avenir incertain de la lecture humaine dans le livre audio / Photo: Thomas SAMSON - AFP/Archives

L'avenir incertain de la lecture humaine dans le livre audio

Faire lire intégralement un livre en vue de sa version audio coûte cher, trop cher pour certains promoteurs de ce format. Alors ils investissent dans le clonage de voix et les voix de synthèse.

Taille du texte:

Nicolas Sarkozy, par exemple, a enregistré en 2021 plus de 13 heures de ses mémoires de président, "Le Temps des tempêtes". Barack Obama a fait plus fort avec "Une terre promise" en 2020: 29 heures.

D'autres livres sont lus par des comédiens. Denis Podalydès a prêté sa voix à "Martin Eden", roman de Jack London. La narratrice du prix Goncourt 2024, "Houris" de Kamel Daoud, est incarnée par Lola Naymark, moins connue.

Mais des productions de ce genre, assez ou très onéreuses, ont un avenir incertain parmi les livres audio, qui font désormais de plus en plus souvent appel à l'intelligence artificielle (IA). Le Festival du livre de Paris, du 11 au 13 avril, a été l'occasion de deux annonces en ce sens.

Librinova, numéro un français de l'auto-édition, a ainsi dit adopter "la technologie de clonage vocal, qui permet d'obtenir une qualité largement supérieure à celle des voix synthétiques, souvent trop robotiques".

Un auteur enregistre la lecture d'une petite partie seulement de son livre et l'IA va extrapoler l'autre partie.

- "Il faut de tout" -

Spotify, le numéro un mondial du streaming, a lui indiqué qu'il investissait un million d'euros pour "des livres narrés par la voix de synthèse", autrement dit une machine qui imite, de plus en plus fidèlement, la voix humaine.

Et d'expliquer: "Les coûts importants de production et l'adoption encore naissante de l'usage du livre audio ont eu pour conséquences de limiter l'offre et le catalogue existant en français".

Spotify indique clairement à ses utilisateurs quelle voix leur fait la lecture. À eux de savoir s'ils acceptent qu'elle soit artificielle.

La plateforme suédoise n'abandonne pas les livres intégralement lus par un humain. "Ils viennent aider les éditeurs en finançant une partie de la production. Pour qu'un marché se développe et soit mature, il faut de tout", souligne auprès de l'AFP le directeur général de Hugo Publishing, Arthur de Saint-Vincent.

Cet éditeur, qui s'est imposé comme le numéro un de la romance en France, a pour sa part annoncé une offensive dans le livre audio, sans IA de son côté. Avec sa maison mère Glénat, il proposera 200 nouveaux titres dans les trois ans à venir.

"Nous en sommes à un stade de développement où nous pouvons investir dans une production de qualité. Donc on veut choisir les voix, travailler avec des comédiens et, avec le partenaire que nous avons choisi, le studio Blynd à Lyon, être intransigeants à chaque fois", avance le patron de Hugo.

- Monotonie -

Tout le monde n'a toutefois pas la trésorerie pour suivre.

En 2021, le numéro un du livre audio dans le monde, Audible, filiale d'Amazon, écrivait sur son site internet français: "Au départ, les livres audio utilisaient la synthèse vocale, c'est-à-dire une voix générée par ordinateur. Aujourd'hui, la voix humaine est privilégiée, car elle permet une plus grande proximité avec le lecteur, plus de chaleur et une meilleure intonation".

Quatre ans plus tard, la recherche "virtual voice" ("voix artificielle") sur son catalogue anglophone donne "plus de 50.000 résultats". L'immense majorité des titres sont signés d'auteurs mal ou pas connus.

La qualité de cette lecture laisse des appréciations contrastées, tantôt enthousiastes sur les progrès rapides de cette technologie, tantôt sceptiques sur ses limitations.

"Je ne pense pas que la narration par IA soit bonne avec les émotions des personnages, hélas", a par exemple commenté sur X Alisanya, autrice anglophone de romans "fantasy" autoédités sur Amazon.

Les voix de synthèse ne bafouillent jamais et commettent de moins en moins d'erreurs dans la prononciation des noms propres. À l'intérieur d'une phrase, elles ont des modulations. Mais sur la longueur elles peuvent devenir monotones: elles ne savent pas (encore) accélérer ou ralentir, monter ou baisser l'intensité, s'agacer, s'étrangler, s'essouffler ni sangloter.

P.Gashi--NZN