Zürcher Nachrichten - L'avenir incertain de la lecture humaine dans le livre audio

EUR -
AED 4.212777
AFN 72.835586
ALL 94.512843
AMD 422.248264
ANG 2.053494
AOA 1052.895931
ARS 1680.790338
AUD 1.635257
AWG 2.067368
AZN 1.95436
BAM 1.956354
BBD 2.309354
BDT 140.73988
BGN 1.939347
BHD 0.432422
BIF 3423.630825
BMD 1.146945
BND 1.480319
BOB 7.92328
BRL 5.90941
BSD 1.146625
BTN 108.087801
BWP 15.582008
BYN 3.185903
BYR 22480.122
BZD 2.305963
CAD 1.623185
CDF 2615.035015
CHF 0.925648
CLF 0.026299
CLP 1035.072439
CNY 7.764364
CNH 7.780559
COP 3960.034063
CRC 520.14739
CUC 1.146945
CUP 30.394043
CVE 110.569964
CZK 24.190336
DJF 203.835517
DKK 7.474072
DOP 66.986043
DZD 152.939427
EGP 57.331754
ERN 17.204175
ETB 181.647461
FJD 2.564
FKP 0.867567
GBP 0.866531
GEL 3.039852
GGP 0.867567
GHS 12.874504
GIP 0.867567
GMD 84.304874
GNF 10064.442782
GTQ 8.746478
GYD 239.84901
HKD 8.988436
HNL 30.606273
HRK 7.533254
HTG 149.77244
HUF 351.906109
IDR 20445.785654
ILS 3.394682
IMP 0.867567
INR 108.1919
IQD 1502.49795
IRR 1577049.375404
ISK 143.976448
JEP 0.867567
JMD 181.171337
JOD 0.813229
JPY 185.008009
KES 148.419043
KGS 100.300781
KHR 4599.249852
KMF 492.617229
KPW 1032.250901
KRW 1752.130969
KWD 0.353179
KYD 0.955446
KZT 559.543917
LAK 25295.872375
LBP 102708.92515
LKR 382.668433
LRD 208.916469
LSL 18.815678
LTL 3.386631
LVL 0.693776
LYD 7.311819
MAD 10.580612
MDL 20.248208
MGA 4817.169398
MKD 61.628611
MMK 2408.272435
MNT 4107.54883
MOP 9.256923
MRU 45.947051
MUR 54.881752
MVR 17.720734
MWK 1992.243861
MXN 19.872547
MYR 4.745948
MZN 73.301688
NAD 18.814173
NGN 1560.350288
NIO 41.990088
NOK 11.102662
NPR 172.945006
NZD 1.997675
OMR 0.441554
PAB 1.14663
PEN 3.881306
PGK 5.032508
PHP 69.638491
PKR 319.223511
PLN 4.259467
PYG 7041.056554
QAR 4.175458
RON 5.239364
RSD 117.183799
RUB 83.845404
RWF 1679.12748
SAR 4.299026
SBD 9.24601
SCR 15.693948
SDG 688.744688
SEK 10.98638
SGD 1.482316
SHP 0.85631
SLE 28.387314
SLL 24050.86738
SOS 655.483268
SRD 42.898615
STD 23739.445827
STN 24.544623
SVC 10.032843
SYP 126.774237
SZL 18.814083
THB 37.723444
TJS 10.63456
TMT 4.014308
TND 3.339618
TOP 2.761569
TRY 53.262066
TTD 7.775237
TWD 36.375404
TZS 3017.595134
UAH 51.508996
UGX 4173.182519
USD 1.146945
UYU 45.84299
UZS 13769.075108
VES 695.774297
VND 30176.12295
VUV 136.226685
WST 3.156058
XAF 656.142926
XAG 0.017685
XAU 0.000276
XCD 3.099677
XCG 2.066386
XDR 0.807102
XOF 648.024305
XPF 119.331742
YER 273.665193
ZAR 18.876464
ZMK 10323.885445
ZMW 20.552914
ZWL 369.315822
  • AEX

    -3.2400

    1078.16

    -0.3%

  • BEL20

    -1.1300

    5647.65

    -0.02%

  • PX1

    -46.5700

    8421.14

    -0.55%

  • ISEQ

    0.0000

    13785.73

    0%

  • OSEBX

    23.1300

    1950.43

    +1.2%

  • PSI20

    62.3800

    9102.6

    +0.69%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    42.0100

    4242.69

    +1%

  • N150

    3.3900

    4235.78

    +0.08%

L'avenir incertain de la lecture humaine dans le livre audio
L'avenir incertain de la lecture humaine dans le livre audio / Photo: Thomas SAMSON - AFP/Archives

L'avenir incertain de la lecture humaine dans le livre audio

Faire lire intégralement un livre en vue de sa version audio coûte cher, trop cher pour certains promoteurs de ce format. Alors ils investissent dans le clonage de voix et les voix de synthèse.

Taille du texte:

Nicolas Sarkozy, par exemple, a enregistré en 2021 plus de 13 heures de ses mémoires de président, "Le Temps des tempêtes". Barack Obama a fait plus fort avec "Une terre promise" en 2020: 29 heures.

D'autres livres sont lus par des comédiens. Denis Podalydès a prêté sa voix à "Martin Eden", roman de Jack London. La narratrice du prix Goncourt 2024, "Houris" de Kamel Daoud, est incarnée par Lola Naymark, moins connue.

Mais des productions de ce genre, assez ou très onéreuses, ont un avenir incertain parmi les livres audio, qui font désormais de plus en plus souvent appel à l'intelligence artificielle (IA). Le Festival du livre de Paris, du 11 au 13 avril, a été l'occasion de deux annonces en ce sens.

Librinova, numéro un français de l'auto-édition, a ainsi dit adopter "la technologie de clonage vocal, qui permet d'obtenir une qualité largement supérieure à celle des voix synthétiques, souvent trop robotiques".

Un auteur enregistre la lecture d'une petite partie seulement de son livre et l'IA va extrapoler l'autre partie.

- "Il faut de tout" -

Spotify, le numéro un mondial du streaming, a lui indiqué qu'il investissait un million d'euros pour "des livres narrés par la voix de synthèse", autrement dit une machine qui imite, de plus en plus fidèlement, la voix humaine.

Et d'expliquer: "Les coûts importants de production et l'adoption encore naissante de l'usage du livre audio ont eu pour conséquences de limiter l'offre et le catalogue existant en français".

Spotify indique clairement à ses utilisateurs quelle voix leur fait la lecture. À eux de savoir s'ils acceptent qu'elle soit artificielle.

La plateforme suédoise n'abandonne pas les livres intégralement lus par un humain. "Ils viennent aider les éditeurs en finançant une partie de la production. Pour qu'un marché se développe et soit mature, il faut de tout", souligne auprès de l'AFP le directeur général de Hugo Publishing, Arthur de Saint-Vincent.

Cet éditeur, qui s'est imposé comme le numéro un de la romance en France, a pour sa part annoncé une offensive dans le livre audio, sans IA de son côté. Avec sa maison mère Glénat, il proposera 200 nouveaux titres dans les trois ans à venir.

"Nous en sommes à un stade de développement où nous pouvons investir dans une production de qualité. Donc on veut choisir les voix, travailler avec des comédiens et, avec le partenaire que nous avons choisi, le studio Blynd à Lyon, être intransigeants à chaque fois", avance le patron de Hugo.

- Monotonie -

Tout le monde n'a toutefois pas la trésorerie pour suivre.

En 2021, le numéro un du livre audio dans le monde, Audible, filiale d'Amazon, écrivait sur son site internet français: "Au départ, les livres audio utilisaient la synthèse vocale, c'est-à-dire une voix générée par ordinateur. Aujourd'hui, la voix humaine est privilégiée, car elle permet une plus grande proximité avec le lecteur, plus de chaleur et une meilleure intonation".

Quatre ans plus tard, la recherche "virtual voice" ("voix artificielle") sur son catalogue anglophone donne "plus de 50.000 résultats". L'immense majorité des titres sont signés d'auteurs mal ou pas connus.

La qualité de cette lecture laisse des appréciations contrastées, tantôt enthousiastes sur les progrès rapides de cette technologie, tantôt sceptiques sur ses limitations.

"Je ne pense pas que la narration par IA soit bonne avec les émotions des personnages, hélas", a par exemple commenté sur X Alisanya, autrice anglophone de romans "fantasy" autoédités sur Amazon.

Les voix de synthèse ne bafouillent jamais et commettent de moins en moins d'erreurs dans la prononciation des noms propres. À l'intérieur d'une phrase, elles ont des modulations. Mais sur la longueur elles peuvent devenir monotones: elles ne savent pas (encore) accélérer ou ralentir, monter ou baisser l'intensité, s'agacer, s'étrangler, s'essouffler ni sangloter.

P.Gashi--NZN