Zürcher Nachrichten - La inteligencia artificial ya engaña a los humanos y eso es un problema, según expertos

EUR -
AED 4.194308
AFN 72.52041
ALL 93.251191
AMD 420.526993
ANG 2.044792
AOA 1047.866508
ARS 1640.876124
AUD 1.632903
AWG 2.055753
AZN 1.940568
BAM 1.924616
BBD 2.301411
BDT 140.268483
BGN 1.931129
BHD 0.430685
BIF 3415.976235
BMD 1.142085
BND 1.463881
BOB 7.924599
BRL 5.814127
BSD 1.142685
BTN 107.996157
BWP 15.31092
BYN 3.163542
BYR 22384.866
BZD 2.298163
CAD 1.616804
CDF 2649.637338
CHF 0.923553
CLF 0.025703
CLP 1011.613063
CNY 7.717583
CNH 7.762335
COP 3923.061975
CRC 520.466966
CUC 1.142085
CUP 30.265253
CVE 108.897894
CZK 23.757709
DJF 202.971194
DKK 7.350619
DOP 66.926117
DZD 151.759082
EGP 56.999403
ERN 17.131275
ETB 180.877736
FJD 2.551076
FKP 0.852527
GBP 0.866828
GEL 3.020814
GGP 0.852527
GHS 12.902933
GIP 0.852527
GMD 83.371845
GNF 10024.649964
GTQ 8.70995
GYD 239.027087
HKD 8.951674
HNL 30.490468
HRK 7.533873
HTG 149.23202
HUF 343.367446
IDR 20270.409831
ILS 3.373828
IMP 0.852527
INR 107.709463
IQD 1496.13135
IRR 1570366.874934
ISK 141.995464
JEP 0.852527
JMD 180.721797
JOD 0.80976
JPY 183.033967
KES 147.923053
KGS 99.875061
KHR 4582.608142
KMF 485.38591
KPW 1027.8769
KRW 1726.678335
KWD 0.351874
KYD 0.952271
KZT 557.24616
LAK 25160.132326
LBP 102273.711812
LKR 382.810738
LRD 208.030589
LSL 18.495904
LTL 3.37228
LVL 0.690836
LYD 7.280814
MAD 10.558596
MDL 19.939917
MGA 4796.756942
MKD 60.629453
MMK 2398.316589
MNT 4087.958667
MOP 9.219419
MRU 45.774818
MUR 53.826741
MVR 17.656913
MWK 1982.659854
MXN 19.87116
MYR 4.642352
MZN 72.981636
NAD 18.503966
NGN 1552.230167
NIO 41.811846
NOK 11.158684
NPR 172.792757
NZD 1.994455
OMR 0.43913
PAB 1.142685
PEN 3.897377
PGK 5.011184
PHP 68.951108
PKR 317.840185
PLN 4.165949
PYG 6973.017439
QAR 4.157763
RON 5.147419
RSD 115.431735
RUB 83.339709
RWF 1699.42248
SAR 4.284982
SBD 9.206832
SCR 16.12067
SDG 685.82127
SEK 10.995541
SGD 1.464187
SHP 0.852682
SLE 28.266937
SLL 23948.955593
SOS 652.710174
SRD 42.636347
STD 23638.85364
STN 24.440619
SVC 9.99809
SYP 126.237051
SZL 18.498214
THB 37.157165
TJS 10.59257
TMT 4.008718
TND 3.325466
TOP 2.749867
TRY 53.042608
TTD 7.76223
TWD 36.042492
TZS 2997.976517
UAH 51.17556
UGX 4227.502529
USD 1.142085
UYU 46.13292
UZS 13710.730262
VES 680.724228
VND 30066.52971
VUV 135.895439
WST 3.129029
XAF 645.498109
XAG 0.017975
XAU 0.000276
XCD 3.086542
XCG 2.059414
XDR 0.803682
XOF 645.27823
XPF 119.331742
YER 272.530062
ZAR 18.866359
ZMK 10280.138245
ZMW 20.196756
ZWL 367.750904
La inteligencia artificial ya engaña a los humanos y eso es un problema, según expertos
La inteligencia artificial ya engaña a los humanos y eso es un problema, según expertos / Foto: Kirill KUDRYAVTSEV - AFP

La inteligencia artificial ya engaña a los humanos y eso es un problema, según expertos

Los expertos han advertido durante mucho tiempo sobre la amenaza que representa el descontrol de la Inteligencia Artificial (IA), pero un nuevo artículo de investigación sobre esta tecnología en expansión sugiere que ya está sucediendo.

Tamaño del texto:

Los sistemas de IA actuales, diseñados para ser honestos, han desarrollado una preocupante habilidad para el engaño, según un artículo de un equipo de científicos publicado en la revista Patterns el viernes.

Y si bien los ejemplos pueden parecer triviales, los problemas subyacentes que exponen podrían tener graves consecuencias, dijo el primer autor Peter Park, becario postdoctoral en el Instituto de Tecnología de Massachusetts (MIT), especializado en seguridad de la IA.

"Estos peligros tienden a descubrirse solo después de ocurrido el hecho", declaró Park a la AFP, para acotar que "nuestra capacidad de entrenarnos para tendencias de honestidad en lugar de tendencias de engaño es muy baja".

A diferencia del software tradicional, los sistemas de IA de aprendizaje profundo no se "escriben" sino que "crecen" mediante un proceso similar a la reproducción selectiva, indicó Park.

Eso significa que el comportamiento de la IA que parece predecible y controlable en un entorno de entrenamiento puede volverse rápidamente impredecible fuera de este.

- Juego de dominación mundial -

La investigación del equipo fue impulsada por el sistema de IA Cicero, del gigante Meta (Facebook, Instagram), diseñado para el juego de estrategia "Diplomacy", donde construir alianzas es clave.

Cicero se destacó, con puntuaciones que lo habrían colocado entre el 10% superior de jugadores humanos experimentados, según un artículo de 2022 publicado en Science.

Park se mostró escéptico ante la elogiosa descripción de la victoria de Cicero proporcionada por Meta, que afirmaba que el sistema era "en gran medida honesto y útil" y que "nunca apuñalaría por la espalda intencionalmente".

Cuando Park y sus colegas profundizaron en el conjunto de datos completo, descubrieron una historia diferente.

En un ejemplo, jugando como Francia, Cicero engañó a Inglaterra (un jugador humano) al conspirar con Alemania (otro usuario real) para invadirla. Cicero prometió protección a Inglaterra y luego le propuso en secreto a Alemania atacar, aprovechándose de la confianza del perjudicado.

En una declaración a la AFP, Meta no refutó la afirmación sobre los engaños de Cicero, pero dijo que se trataba "meramente de un proyecto de investigación, y los modelos que nuestros investigadores construyeron están entrenados únicamente para participar en el juego Diplomacy".

"No tenemos planes de utilizar esta investigación o sus aprendizajes en nuestros productos", añadió.

- ¿Eres un robot? -

Una amplia revisión realizada por Park y sus colegas encontró que éste era solo uno de los muchos casos en varios sistemas de IA que utilizaban el engaño para lograr objetivos sin instrucciones explícitas para hacerlo.

En un ejemplo sorprendente, el robot conversacional Chat GPT-4 de OpenAI engañó a un trabajador independiente de la plataforma TaskRabbit para que realizara una tarea de verificación de identidad CAPTCHA del tipo "No soy un robot".

Cuando el humano preguntó en broma a GPT-4 si en realidad era un robot, la IA respondió: "No, no soy un robot. Tengo una discapacidad visual que me dificulta ver las imágenes". Luego, el trabajador resolvió el rompecabezas planteado.

A corto plazo, los autores del artículo ven riesgos de que la IA cometa fraude o altere por ejemplo, unas elecciones.

En el peor de los casos, advirtieron sobre una IA superinteligente que podría perseguir conseguir el poder y el control sobre la sociedad, lo que llevaría a la pérdida de decisiones humanas o incluso a la extinción si sus "objetivos misteriosos" se alinearan con estos resultados.

Para mitigar los riesgos, el equipo propone varias medidas: leyes de "bot o no" que exigen a las empresas revelar interacciones humanas o de IA, marcas de agua digitales para el contenido generado por la nueva tecnología y el desarrollo de mecanismos para detectar el engaño potencial examinando sus "procesos de pensamiento" internos "contra acciones externas.

A aquellos que lo llaman pesimista, Park les responde: "La única forma en que podemos pensar razonablemente que esto no es gran cosa es si pensamos que las capacidades engañosas de la IA se mantendrán en los niveles actuales y no se desarrollarán más sustancialmente".

N.Zaugg--NZN