Zürcher Nachrichten - La inteligencia artificial ya engaña a los humanos y eso es un problema, según expertos

EUR -
AED 4.250678
AFN 72.918041
ALL 96.067465
AMD 436.932685
ANG 2.071904
AOA 1061.367148
ARS 1614.573682
AUD 1.634575
AWG 2.086276
AZN 1.972142
BAM 1.972698
BBD 2.332168
BDT 142.080747
BGN 1.978413
BHD 0.436949
BIF 3437.580732
BMD 1.157435
BND 1.485596
BOB 8.001925
BRL 6.042616
BSD 1.157939
BTN 107.880297
BWP 15.801103
BYN 3.580572
BYR 22685.717965
BZD 2.32886
CAD 1.590258
CDF 2633.163673
CHF 0.913169
CLF 0.026762
CLP 1056.726175
CNY 7.98682
CNH 7.967438
COP 4274.220751
CRC 541.77124
CUC 1.157435
CUP 30.672017
CVE 112.32935
CZK 24.46157
DJF 205.69948
DKK 7.470818
DOP 68.086114
DZD 153.068157
EGP 60.468898
ERN 17.361519
ETB 181.942975
FJD 2.556252
FKP 0.868855
GBP 0.862243
GEL 3.142482
GGP 0.868855
GHS 12.612219
GIP 0.868855
GMD 85.650189
GNF 10159.345308
GTQ 8.857761
GYD 242.257739
HKD 9.066706
HNL 30.752706
HRK 7.534086
HTG 151.887632
HUF 390.323942
IDR 19551.674454
ILS 3.619692
IMP 0.868855
INR 107.73737
IQD 1516.239313
IRR 1522171.1655
ISK 143.799756
JEP 0.868855
JMD 181.912765
JOD 0.820653
JPY 182.822601
KES 150.005481
KGS 101.215228
KHR 4641.312752
KMF 495.381662
KPW 1041.677217
KRW 1723.362105
KWD 0.354453
KYD 0.965012
KZT 556.866583
LAK 24855.907577
LBP 103648.268002
LKR 360.942102
LRD 212.274287
LSL 19.479641
LTL 3.417604
LVL 0.70012
LYD 7.384117
MAD 10.832141
MDL 20.292792
MGA 4820.714971
MKD 61.634594
MMK 2430.311069
MNT 4150.377902
MOP 9.342916
MRU 46.424425
MUR 53.832532
MVR 17.88262
MWK 2010.463866
MXN 20.538231
MYR 4.559163
MZN 73.961088
NAD 19.479093
NGN 1570.409946
NIO 42.500812
NOK 10.997709
NPR 172.603009
NZD 1.971059
OMR 0.445035
PAB 1.157979
PEN 3.99836
PGK 4.979257
PHP 69.211938
PKR 323.097975
PLN 4.267571
PYG 7524.225019
QAR 4.218386
RON 5.093054
RSD 117.434432
RUB 99.715141
RWF 1688.697067
SAR 4.345484
SBD 9.315708
SCR 16.728436
SDG 695.617571
SEK 10.760999
SGD 1.479253
SHP 0.868376
SLE 28.53087
SLL 24270.837165
SOS 661.476645
SRD 43.40615
STD 23956.559163
STN 24.884844
SVC 10.132098
SYP 127.929815
SZL 19.479951
THB 37.605283
TJS 11.087547
TMT 4.051021
TND 3.369582
TOP 2.786824
TRY 51.283377
TTD 7.848604
TWD 36.825979
TZS 3006.437007
UAH 50.920909
UGX 4376.679727
USD 1.157435
UYU 46.903191
UZS 14114.91435
VES 526.268876
VND 30428.955372
VUV 138.207434
WST 3.162366
XAF 661.659074
XAG 0.015864
XAU 0.000249
XCD 3.128025
XCG 2.086894
XDR 0.822888
XOF 661.473924
XPF 119.331742
YER 276.106212
ZAR 19.366681
ZMK 10418.297556
ZMW 22.667344
ZWL 372.693466
La inteligencia artificial ya engaña a los humanos y eso es un problema, según expertos
La inteligencia artificial ya engaña a los humanos y eso es un problema, según expertos / Foto: Kirill KUDRYAVTSEV - AFP

La inteligencia artificial ya engaña a los humanos y eso es un problema, según expertos

Los expertos han advertido durante mucho tiempo sobre la amenaza que representa el descontrol de la Inteligencia Artificial (IA), pero un nuevo artículo de investigación sobre esta tecnología en expansión sugiere que ya está sucediendo.

Tamaño del texto:

Los sistemas de IA actuales, diseñados para ser honestos, han desarrollado una preocupante habilidad para el engaño, según un artículo de un equipo de científicos publicado en la revista Patterns el viernes.

Y si bien los ejemplos pueden parecer triviales, los problemas subyacentes que exponen podrían tener graves consecuencias, dijo el primer autor Peter Park, becario postdoctoral en el Instituto de Tecnología de Massachusetts (MIT), especializado en seguridad de la IA.

"Estos peligros tienden a descubrirse solo después de ocurrido el hecho", declaró Park a la AFP, para acotar que "nuestra capacidad de entrenarnos para tendencias de honestidad en lugar de tendencias de engaño es muy baja".

A diferencia del software tradicional, los sistemas de IA de aprendizaje profundo no se "escriben" sino que "crecen" mediante un proceso similar a la reproducción selectiva, indicó Park.

Eso significa que el comportamiento de la IA que parece predecible y controlable en un entorno de entrenamiento puede volverse rápidamente impredecible fuera de este.

- Juego de dominación mundial -

La investigación del equipo fue impulsada por el sistema de IA Cicero, del gigante Meta (Facebook, Instagram), diseñado para el juego de estrategia "Diplomacy", donde construir alianzas es clave.

Cicero se destacó, con puntuaciones que lo habrían colocado entre el 10% superior de jugadores humanos experimentados, según un artículo de 2022 publicado en Science.

Park se mostró escéptico ante la elogiosa descripción de la victoria de Cicero proporcionada por Meta, que afirmaba que el sistema era "en gran medida honesto y útil" y que "nunca apuñalaría por la espalda intencionalmente".

Cuando Park y sus colegas profundizaron en el conjunto de datos completo, descubrieron una historia diferente.

En un ejemplo, jugando como Francia, Cicero engañó a Inglaterra (un jugador humano) al conspirar con Alemania (otro usuario real) para invadirla. Cicero prometió protección a Inglaterra y luego le propuso en secreto a Alemania atacar, aprovechándose de la confianza del perjudicado.

En una declaración a la AFP, Meta no refutó la afirmación sobre los engaños de Cicero, pero dijo que se trataba "meramente de un proyecto de investigación, y los modelos que nuestros investigadores construyeron están entrenados únicamente para participar en el juego Diplomacy".

"No tenemos planes de utilizar esta investigación o sus aprendizajes en nuestros productos", añadió.

- ¿Eres un robot? -

Una amplia revisión realizada por Park y sus colegas encontró que éste era solo uno de los muchos casos en varios sistemas de IA que utilizaban el engaño para lograr objetivos sin instrucciones explícitas para hacerlo.

En un ejemplo sorprendente, el robot conversacional Chat GPT-4 de OpenAI engañó a un trabajador independiente de la plataforma TaskRabbit para que realizara una tarea de verificación de identidad CAPTCHA del tipo "No soy un robot".

Cuando el humano preguntó en broma a GPT-4 si en realidad era un robot, la IA respondió: "No, no soy un robot. Tengo una discapacidad visual que me dificulta ver las imágenes". Luego, el trabajador resolvió el rompecabezas planteado.

A corto plazo, los autores del artículo ven riesgos de que la IA cometa fraude o altere por ejemplo, unas elecciones.

En el peor de los casos, advirtieron sobre una IA superinteligente que podría perseguir conseguir el poder y el control sobre la sociedad, lo que llevaría a la pérdida de decisiones humanas o incluso a la extinción si sus "objetivos misteriosos" se alinearan con estos resultados.

Para mitigar los riesgos, el equipo propone varias medidas: leyes de "bot o no" que exigen a las empresas revelar interacciones humanas o de IA, marcas de agua digitales para el contenido generado por la nueva tecnología y el desarrollo de mecanismos para detectar el engaño potencial examinando sus "procesos de pensamiento" internos "contra acciones externas.

A aquellos que lo llaman pesimista, Park les responde: "La única forma en que podemos pensar razonablemente que esto no es gran cosa es si pensamos que las capacidades engañosas de la IA se mantendrán en los niveles actuales y no se desarrollarán más sustancialmente".

N.Zaugg--NZN