Zürcher Nachrichten - La diversidad del español, enloquecedora para la inteligencia artificial

EUR -
AED 4.224055
AFN 73.034746
ALL 93.912556
AMD 423.509494
ANG 2.059295
AOA 1055.298283
ARS 1652.513696
AUD 1.637006
AWG 2.070333
AZN 1.954332
BAM 1.938266
BBD 2.317733
BDT 141.263308
BGN 1.944825
BHD 0.433739
BIF 3440.203335
BMD 1.150185
BND 1.474263
BOB 7.980803
BRL 5.855363
BSD 1.15079
BTN 108.762098
BWP 15.419509
BYN 3.185978
BYR 22543.626
BZD 2.314463
CAD 1.623049
CDF 2668.429339
CHF 0.921954
CLF 0.025886
CLP 1018.787718
CNY 7.772318
CNH 7.779921
COP 3950.885475
CRC 524.15827
CUC 1.150185
CUP 30.479903
CVE 109.670229
CZK 23.926206
DJF 204.410724
DKK 7.402752
DOP 67.400776
DZD 152.835402
EGP 57.40366
ERN 17.252775
ETB 182.160574
FJD 2.569169
FKP 0.858573
GBP 0.866384
GEL 3.042238
GGP 0.858573
GHS 12.994445
GIP 0.858573
GMD 83.963142
GNF 10095.747706
GTQ 8.771724
GYD 240.722336
HKD 9.014132
HNL 30.706716
HRK 7.532445
HTG 150.290417
HUF 345.802709
IDR 20414.173491
ILS 3.38297
IMP 0.858573
INR 108.47337
IQD 1506.74235
IRR 1581504.374934
ISK 143.002537
JEP 0.858573
JMD 182.003529
JOD 0.815503
JPY 184.332097
KES 148.972166
KGS 100.583404
KHR 4615.109336
KMF 488.828408
KPW 1035.166903
KRW 1738.924442
KWD 0.35437
KYD 0.959024
KZT 561.198313
LAK 25338.575324
LBP 102999.066812
LKR 385.525743
LRD 209.506002
LSL 18.627083
LTL 3.396197
LVL 0.695736
LYD 7.332452
MAD 10.63348
MDL 20.081337
MGA 4830.776941
MKD 61.059454
MMK 2415.32615
MNT 4116.951662
MOP 9.284806
MRU 46.099467
MUR 54.208496
MVR 17.782141
MWK 1996.721456
MXN 19.882477
MYR 4.675277
MZN 73.499243
NAD 18.635202
NGN 1563.239036
NIO 42.108388
NOK 11.060296
NPR 174.018253
NZD 1.990508
OMR 0.442244
PAB 1.15079
PEN 3.925018
PGK 5.046724
PHP 69.44013
PKR 320.0944
PLN 4.195495
PYG 7022.472113
QAR 4.187251
RON 5.183926
RSD 116.25041
RUB 83.930778
RWF 1711.47528
SAR 4.315372
SBD 9.272129
SCR 16.235003
SDG 690.685314
SEK 10.948358
SGD 1.474571
SHP 0.858729
SLE 28.467414
SLL 24118.808572
SOS 657.339385
SRD 42.938737
STD 23806.507286
STN 24.613959
SVC 10.069
SYP 127.132361
SZL 18.629409
THB 37.420695
TJS 10.667696
TMT 4.037149
TND 3.349052
TOP 2.76937
TRY 53.420578
TTD 7.817282
TWD 36.298116
TZS 3019.239041
UAH 51.538512
UGX 4257.48521
USD 1.150185
UYU 46.460109
UZS 13807.970761
VES 685.552123
VND 30279.77031
VUV 136.859249
WST 3.151221
XAF 650.07617
XAG 0.016846
XAU 0.000268
XCD 3.108433
XCG 2.07402
XDR 0.809382
XOF 649.854731
XPF 119.331742
YER 274.462925
ZAR 18.840732
ZMK 10353.037051
ZMW 20.339997
ZWL 370.359101
La diversidad del español, enloquecedora para la inteligencia artificial
La diversidad del español, enloquecedora para la inteligencia artificial / Foto: Josep Lago - AFP/Archivos

La diversidad del español, enloquecedora para la inteligencia artificial

La inteligencia artificial necesitará mucho alimento para que todo hablante del español se pueda dirigir a ella con naturalidad, teniendo en cuenta sus 21 variedades nacionales, acentos, subacentos y jergas como la gaditana o el lunfardo.

Tamaño del texto:

Uno de los temas centrales del IX Congreso Internacional de la Lengua Española (CILE) que se celebra en la ciudad andaluza de Cádiz del lunes al jueves es la inteligencia artificial, y el acto inaugural dejó un momento que da una idea del trecho que tienen que recorrer las máquinas.

Fue cuando el alcalde de la ciudad anfitriona, José María González Santos, más conocido como Kichi, le deseó a los participantes que lo pasen bien, en pura habla gaditana.

"Señoras y señores, estén al 'liquindoi', aprovechen 'la collá' y la 'conviá', disfruten del 'tangai', para que cuando les toque 'guannajarse' puedan decir con orgullo que este congreso ha sido un 'bastinazo'", lanzó Kichi.

Pues bien, esto es lo que transcribió uno de los programas más populares del mundo: "señoras y señores, China lindo y aproveche la ***** y la cumbia y disfruten del tangai para que cuando les toque guardarse puedan decir con orgullo que este congreso ha sido un partidazo".

Esto, explicó a la AFP Virginia Bertolotti, lingüista uruguaya, "es una muestra de que si alimentamos las inteligencias artificiales con algo que es relativamente plano, como es internet, hay cosas que hacen muy bien, pero hay cosas que no pueden hacer".

"Si yo le digo 'hazme un diálogo entre gauchos del siglo XIX', hace cualquier cosa", sostuvo esta catedrática de la Universidad de la República, miembro de la Academia de Letras de Uruguay.

- Correctores incorrectos -

La inteligencia artificial es la "disciplina científica que se ocupa de crear programas informáticos que ejecutan operaciones comparables a las que realiza la mente humana", según la definición de la Real Academia de la Lengua (RAE), que la eligió palabra del año en 2022.

Es un campo con mucho en juego, indicó el ministro español de Asuntos Exteriores, José Manuel Albares, cuando advirtió que hay que "posicionar el español en el núcleo central de la Inteligencia Artificial (IA), en el metaverso".

Muchos de los inventos de esta nueva disciplina son ya de uso común, como los correctores, los traductores, o los redactores o "chatbots".

El problema de estas herramientas, advirtió el director de la Real Academia de la Lengua, Santiago Muñoz Machado, es que estos instrumentos "no usan el canon panhispánico de la lengua, sino el canon de Silicón Valley".

"Hemos advertido en la Academia que lo que nos corrige ese corrector, normalmente no es correcto, y no son juegos de palabras, es exactamente así", ahondó.

El remedio, explicó Bertolotti, sería "sofisticar" la gran cantidad de datos que la inteligencia artificial barre de internet, mediante "muchos materiales que son pequeños corpus de especialidades, que hemos ido trabajando en investigación lingüística".

"El habla de la calle, el habla cotidiana, en el caso del español, que es una lengua de mucho espesor cultural, con una gran distribución geográfica, no necesariamente está capturado por el tipo de datos que se suelen utilizar para entrenar a las inteligencias artificiales", argumentó la lingüista.

- El problema de la lista de la compra -

Asunción Gómez-Pérez, miembro de la RAE y asesora en inteligencia artificial del gobierno de España, cree que podría acabar dándose el caso de que unas variantes del español acaben siendo más dominantes que otras en la inteligencia artificial.

"Los modelos del lenguaje que estamos utilizando ahora se nutren de grandes cantidades de textos que han sido escritos por personas las cuales pertenecen a ciertos países y utilizan cierto vocabulario", explicó a la AFP.

"Cuantos más textos haya de una variante, más posibilidades tiene esa variedad de ser la aceptada", concluyó Gómez-Pérez.

Si acaba siendo el caso, esas avanzadillas domésticas de la inteligencia artificial que son Siri y Alexa sufrirán para entender que cuando se les pide que incluyan en la lista del supermercado ejotes, agujas, chauchas, frijoles verdes, navajitas o judías verdes, se les está pidiendo exactamente lo mismo.

F.Carpenteri--NZN