Zürcher Nachrichten - L'avenir incertain de la lecture humaine dans le livre audio

EUR -
AED 4.307361
AFN 75.063795
ALL 95.53007
AMD 434.876114
ANG 2.099301
AOA 1076.694146
ARS 1633.63202
AUD 1.626162
AWG 2.111165
AZN 2.066885
BAM 1.958337
BBD 2.362792
BDT 143.940577
BGN 1.956466
BHD 0.442934
BIF 3490.459203
BMD 1.172869
BND 1.49646
BOB 8.106088
BRL 5.816956
BSD 1.173135
BTN 111.283968
BWP 15.942808
BYN 3.310457
BYR 22988.239372
BZD 2.359378
CAD 1.593056
CDF 2721.056657
CHF 0.916111
CLF 0.026813
CLP 1055.289597
CNY 8.008645
CNH 8.009988
COP 4289.535095
CRC 533.345473
CUC 1.172869
CUP 31.081038
CVE 110.777586
CZK 24.363957
DJF 208.442272
DKK 7.472122
DOP 69.78868
DZD 155.409815
EGP 62.908723
ERN 17.59304
ETB 184.140682
FJD 2.571047
FKP 0.863957
GBP 0.863378
GEL 3.142967
GGP 0.863957
GHS 13.155579
GIP 0.863957
GMD 85.61901
GNF 10291.928671
GTQ 8.962489
GYD 245.425715
HKD 9.189343
HNL 31.221407
HRK 7.535338
HTG 153.674796
HUF 362.682282
IDR 20330.927916
ILS 3.452728
IMP 0.863957
INR 111.317619
IQD 1536.458856
IRR 1541150.333205
ISK 143.805533
JEP 0.863957
JMD 183.818121
JOD 0.831577
JPY 183.987426
KES 151.476373
KGS 102.532828
KHR 4706.137263
KMF 492.604693
KPW 1055.582391
KRW 1725.11506
KWD 0.360411
KYD 0.977637
KZT 543.376443
LAK 25779.668401
LBP 105030.45096
LKR 374.932456
LRD 215.661377
LSL 19.539898
LTL 3.463178
LVL 0.709457
LYD 7.447525
MAD 10.850507
MDL 20.212649
MGA 4867.407882
MKD 61.651274
MMK 2462.427637
MNT 4196.351252
MOP 9.466049
MRU 46.87896
MUR 55.160312
MVR 18.126721
MWK 2042.550462
MXN 20.458714
MYR 4.641629
MZN 74.945338
NAD 19.540266
NGN 1613.845165
NIO 43.055834
NOK 10.892995
NPR 178.045788
NZD 1.985474
OMR 0.451256
PAB 1.173105
PEN 4.113838
PGK 5.088787
PHP 71.867622
PKR 326.966677
PLN 4.244092
PYG 7215.053945
QAR 4.273352
RON 5.197804
RSD 117.411948
RUB 87.926676
RWF 1714.148563
SAR 4.398236
SBD 9.432344
SCR 16.122641
SDG 704.311222
SEK 10.807012
SGD 1.492717
SHP 0.875665
SLE 28.820051
SLL 24594.479457
SOS 669.708053
SRD 43.933385
STD 24276.027649
STN 24.876559
SVC 10.265304
SYP 129.631364
SZL 19.539884
THB 38.106997
TJS 11.003652
TMT 4.110907
TND 3.379916
TOP 2.823988
TRY 53.002903
TTD 7.963062
TWD 37.097275
TZS 3055.325098
UAH 51.546829
UGX 4411.146791
USD 1.172869
UYU 46.785194
UZS 14015.788564
VES 573.465974
VND 30912.144739
VUV 137.989709
WST 3.184562
XAF 656.855506
XAG 0.015475
XAU 0.000254
XCD 3.169738
XCG 2.114273
XDR 0.815883
XOF 656.806871
XPF 119.331742
YER 279.844213
ZAR 19.453035
ZMK 10557.229877
ZMW 21.907968
ZWL 377.663454
  • AEX

    16.9500

    1014.09

    +1.7%

  • BEL20

    72.8600

    5352.67

    +1.38%

  • PX1

    42.7800

    8114.84

    +0.53%

  • ISEQ

    167.7500

    12593.36

    +1.35%

  • OSEBX

    21.5700

    2018.63

    +1.08%

  • PSI20

    135.3800

    9344.96

    +1.47%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    71.6400

    3902.45

    +1.87%

  • N150

    52.5100

    4154.58

    +1.28%

L'avenir incertain de la lecture humaine dans le livre audio
L'avenir incertain de la lecture humaine dans le livre audio / Photo: Thomas SAMSON - AFP/Archives

L'avenir incertain de la lecture humaine dans le livre audio

Faire lire intégralement un livre en vue de sa version audio coûte cher, trop cher pour certains promoteurs de ce format. Alors ils investissent dans le clonage de voix et les voix de synthèse.

Taille du texte:

Nicolas Sarkozy, par exemple, a enregistré en 2021 plus de 13 heures de ses mémoires de président, "Le Temps des tempêtes". Barack Obama a fait plus fort avec "Une terre promise" en 2020: 29 heures.

D'autres livres sont lus par des comédiens. Denis Podalydès a prêté sa voix à "Martin Eden", roman de Jack London. La narratrice du prix Goncourt 2024, "Houris" de Kamel Daoud, est incarnée par Lola Naymark, moins connue.

Mais des productions de ce genre, assez ou très onéreuses, ont un avenir incertain parmi les livres audio, qui font désormais de plus en plus souvent appel à l'intelligence artificielle (IA). Le Festival du livre de Paris, du 11 au 13 avril, a été l'occasion de deux annonces en ce sens.

Librinova, numéro un français de l'auto-édition, a ainsi dit adopter "la technologie de clonage vocal, qui permet d'obtenir une qualité largement supérieure à celle des voix synthétiques, souvent trop robotiques".

Un auteur enregistre la lecture d'une petite partie seulement de son livre et l'IA va extrapoler l'autre partie.

- "Il faut de tout" -

Spotify, le numéro un mondial du streaming, a lui indiqué qu'il investissait un million d'euros pour "des livres narrés par la voix de synthèse", autrement dit une machine qui imite, de plus en plus fidèlement, la voix humaine.

Et d'expliquer: "Les coûts importants de production et l'adoption encore naissante de l'usage du livre audio ont eu pour conséquences de limiter l'offre et le catalogue existant en français".

Spotify indique clairement à ses utilisateurs quelle voix leur fait la lecture. À eux de savoir s'ils acceptent qu'elle soit artificielle.

La plateforme suédoise n'abandonne pas les livres intégralement lus par un humain. "Ils viennent aider les éditeurs en finançant une partie de la production. Pour qu'un marché se développe et soit mature, il faut de tout", souligne auprès de l'AFP le directeur général de Hugo Publishing, Arthur de Saint-Vincent.

Cet éditeur, qui s'est imposé comme le numéro un de la romance en France, a pour sa part annoncé une offensive dans le livre audio, sans IA de son côté. Avec sa maison mère Glénat, il proposera 200 nouveaux titres dans les trois ans à venir.

"Nous en sommes à un stade de développement où nous pouvons investir dans une production de qualité. Donc on veut choisir les voix, travailler avec des comédiens et, avec le partenaire que nous avons choisi, le studio Blynd à Lyon, être intransigeants à chaque fois", avance le patron de Hugo.

- Monotonie -

Tout le monde n'a toutefois pas la trésorerie pour suivre.

En 2021, le numéro un du livre audio dans le monde, Audible, filiale d'Amazon, écrivait sur son site internet français: "Au départ, les livres audio utilisaient la synthèse vocale, c'est-à-dire une voix générée par ordinateur. Aujourd'hui, la voix humaine est privilégiée, car elle permet une plus grande proximité avec le lecteur, plus de chaleur et une meilleure intonation".

Quatre ans plus tard, la recherche "virtual voice" ("voix artificielle") sur son catalogue anglophone donne "plus de 50.000 résultats". L'immense majorité des titres sont signés d'auteurs mal ou pas connus.

La qualité de cette lecture laisse des appréciations contrastées, tantôt enthousiastes sur les progrès rapides de cette technologie, tantôt sceptiques sur ses limitations.

"Je ne pense pas que la narration par IA soit bonne avec les émotions des personnages, hélas", a par exemple commenté sur X Alisanya, autrice anglophone de romans "fantasy" autoédités sur Amazon.

Les voix de synthèse ne bafouillent jamais et commettent de moins en moins d'erreurs dans la prononciation des noms propres. À l'intérieur d'une phrase, elles ont des modulations. Mais sur la longueur elles peuvent devenir monotones: elles ne savent pas (encore) accélérer ou ralentir, monter ou baisser l'intensité, s'agacer, s'étrangler, s'essouffler ni sangloter.

P.Gashi--NZN