Zürcher Nachrichten - La diversidad del español, enloquecedora para la inteligencia artificial

EUR -
AED 4.351869
AFN 77.023985
ALL 96.63237
AMD 452.823666
ANG 2.121224
AOA 1086.634242
ARS 1714.678669
AUD 1.704125
AWG 2.135942
AZN 2.016552
BAM 1.955039
BBD 2.405763
BDT 145.96316
BGN 1.990034
BHD 0.448925
BIF 3538.721986
BMD 1.184989
BND 1.512711
BOB 8.253786
BRL 6.228891
BSD 1.194435
BTN 109.687287
BWP 15.628914
BYN 3.402075
BYR 23225.775647
BZD 2.402265
CAD 1.612331
CDF 2683.999101
CHF 0.915765
CLF 0.026002
CLP 1026.709185
CNY 8.237744
CNH 8.246608
COP 4348.606608
CRC 591.469676
CUC 1.184989
CUP 31.402197
CVE 110.222078
CZK 24.343237
DJF 212.697174
DKK 7.467211
DOP 75.200716
DZD 154.410871
EGP 55.902865
ERN 17.774828
ETB 185.552144
FJD 2.612485
FKP 0.865555
GBP 0.865271
GEL 3.193574
GGP 0.865555
GHS 13.084905
GIP 0.865555
GMD 86.504497
GNF 10480.918624
GTQ 9.161432
GYD 249.892689
HKD 9.256278
HNL 31.526723
HRK 7.534037
HTG 156.319128
HUF 380.877851
IDR 19876.405501
ILS 3.662095
IMP 0.865555
INR 108.656932
IQD 1564.790655
IRR 49917.642999
ISK 144.93564
JEP 0.865555
JMD 187.177111
JOD 0.840116
JPY 183.471566
KES 154.209949
KGS 103.627087
KHR 4803.129613
KMF 491.769793
KPW 1066.4897
KRW 1719.182195
KWD 0.363696
KYD 0.995412
KZT 600.736067
LAK 25704.990216
LBP 106962.747619
LKR 369.386157
LRD 215.296161
LSL 18.965415
LTL 3.498963
LVL 0.716788
LYD 7.495081
MAD 10.834781
MDL 20.090177
MGA 5337.921359
MKD 61.616006
MMK 2488.865218
MNT 4226.121106
MOP 9.60526
MRU 47.658441
MUR 53.834423
MVR 18.319442
MWK 2071.193456
MXN 20.620577
MYR 4.671242
MZN 75.555046
NAD 18.965415
NGN 1642.962557
NIO 43.952884
NOK 11.418882
NPR 175.499659
NZD 1.97076
OMR 0.457862
PAB 1.194435
PEN 3.993545
PGK 5.113009
PHP 69.813597
PKR 334.176468
PLN 4.213363
PYG 8000.884374
QAR 4.354904
RON 5.095326
RSD 117.354301
RUB 90.534923
RWF 1742.721367
SAR 4.44571
SBD 9.54107
SCR 17.197303
SDG 712.773565
SEK 10.560067
SGD 1.50588
SHP 0.889048
SLE 28.824866
SLL 24848.616602
SOS 682.634175
SRD 45.089405
STD 24526.870573
STN 24.490463
SVC 10.45093
SYP 13105.469656
SZL 18.959617
THB 37.213986
TJS 11.150158
TMT 4.14746
TND 3.431864
TOP 2.853168
TRY 51.538109
TTD 8.109842
TWD 37.443255
TZS 3075.70229
UAH 51.194065
UGX 4270.337087
USD 1.184989
UYU 46.35195
UZS 14602.313711
VES 409.936611
VND 30738.603075
VUV 140.766514
WST 3.212244
XAF 655.701663
XAG 0.013999
XAU 0.000244
XCD 3.202491
XCG 2.152662
XDR 0.815482
XOF 655.701663
XPF 119.331742
YER 282.412399
ZAR 19.100534
ZMK 10666.318069
ZMW 23.440872
ZWL 381.565831
La diversidad del español, enloquecedora para la inteligencia artificial
La diversidad del español, enloquecedora para la inteligencia artificial / Foto: Josep Lago - AFP/Archivos

La diversidad del español, enloquecedora para la inteligencia artificial

La inteligencia artificial necesitará mucho alimento para que todo hablante del español se pueda dirigir a ella con naturalidad, teniendo en cuenta sus 21 variedades nacionales, acentos, subacentos y jergas como la gaditana o el lunfardo.

Tamaño del texto:

Uno de los temas centrales del IX Congreso Internacional de la Lengua Española (CILE) que se celebra en la ciudad andaluza de Cádiz del lunes al jueves es la inteligencia artificial, y el acto inaugural dejó un momento que da una idea del trecho que tienen que recorrer las máquinas.

Fue cuando el alcalde de la ciudad anfitriona, José María González Santos, más conocido como Kichi, le deseó a los participantes que lo pasen bien, en pura habla gaditana.

"Señoras y señores, estén al 'liquindoi', aprovechen 'la collá' y la 'conviá', disfruten del 'tangai', para que cuando les toque 'guannajarse' puedan decir con orgullo que este congreso ha sido un 'bastinazo'", lanzó Kichi.

Pues bien, esto es lo que transcribió uno de los programas más populares del mundo: "señoras y señores, China lindo y aproveche la ***** y la cumbia y disfruten del tangai para que cuando les toque guardarse puedan decir con orgullo que este congreso ha sido un partidazo".

Esto, explicó a la AFP Virginia Bertolotti, lingüista uruguaya, "es una muestra de que si alimentamos las inteligencias artificiales con algo que es relativamente plano, como es internet, hay cosas que hacen muy bien, pero hay cosas que no pueden hacer".

"Si yo le digo 'hazme un diálogo entre gauchos del siglo XIX', hace cualquier cosa", sostuvo esta catedrática de la Universidad de la República, miembro de la Academia de Letras de Uruguay.

- Correctores incorrectos -

La inteligencia artificial es la "disciplina científica que se ocupa de crear programas informáticos que ejecutan operaciones comparables a las que realiza la mente humana", según la definición de la Real Academia de la Lengua (RAE), que la eligió palabra del año en 2022.

Es un campo con mucho en juego, indicó el ministro español de Asuntos Exteriores, José Manuel Albares, cuando advirtió que hay que "posicionar el español en el núcleo central de la Inteligencia Artificial (IA), en el metaverso".

Muchos de los inventos de esta nueva disciplina son ya de uso común, como los correctores, los traductores, o los redactores o "chatbots".

El problema de estas herramientas, advirtió el director de la Real Academia de la Lengua, Santiago Muñoz Machado, es que estos instrumentos "no usan el canon panhispánico de la lengua, sino el canon de Silicón Valley".

"Hemos advertido en la Academia que lo que nos corrige ese corrector, normalmente no es correcto, y no son juegos de palabras, es exactamente así", ahondó.

El remedio, explicó Bertolotti, sería "sofisticar" la gran cantidad de datos que la inteligencia artificial barre de internet, mediante "muchos materiales que son pequeños corpus de especialidades, que hemos ido trabajando en investigación lingüística".

"El habla de la calle, el habla cotidiana, en el caso del español, que es una lengua de mucho espesor cultural, con una gran distribución geográfica, no necesariamente está capturado por el tipo de datos que se suelen utilizar para entrenar a las inteligencias artificiales", argumentó la lingüista.

- El problema de la lista de la compra -

Asunción Gómez-Pérez, miembro de la RAE y asesora en inteligencia artificial del gobierno de España, cree que podría acabar dándose el caso de que unas variantes del español acaben siendo más dominantes que otras en la inteligencia artificial.

"Los modelos del lenguaje que estamos utilizando ahora se nutren de grandes cantidades de textos que han sido escritos por personas las cuales pertenecen a ciertos países y utilizan cierto vocabulario", explicó a la AFP.

"Cuantos más textos haya de una variante, más posibilidades tiene esa variedad de ser la aceptada", concluyó Gómez-Pérez.

Si acaba siendo el caso, esas avanzadillas domésticas de la inteligencia artificial que son Siri y Alexa sufrirán para entender que cuando se les pide que incluyan en la lista del supermercado ejotes, agujas, chauchas, frijoles verdes, navajitas o judías verdes, se les está pidiendo exactamente lo mismo.

F.Carpenteri--NZN