Zürcher Nachrichten - La inteligencia artificial ya engaña a los humanos y eso es un problema, según expertos

EUR -
AED 4.296525
AFN 74.874664
ALL 95.983925
AMD 433.927327
ANG 2.09402
AOA 1073.986263
ARS 1629.105392
AUD 1.629005
AWG 2.105854
AZN 1.991712
BAM 1.955473
BBD 2.356632
BDT 143.595337
BGN 1.951544
BHD 0.442226
BIF 3496.56957
BMD 1.169919
BND 1.49265
BOB 8.115641
BRL 5.809352
BSD 1.170069
BTN 111.224372
BWP 15.88334
BYN 3.309646
BYR 22930.413655
BZD 2.353706
CAD 1.592827
CDF 2714.212348
CHF 0.917357
CLF 0.026787
CLP 1054.261312
CNY 7.988499
CNH 7.98712
COP 4278.686497
CRC 532.008626
CUC 1.169919
CUP 31.002855
CVE 110.246536
CZK 24.392052
DJF 208.405097
DKK 7.472384
DOP 69.594365
DZD 155.030644
EGP 62.64893
ERN 17.548786
ETB 182.743994
FJD 2.570193
FKP 0.86132
GBP 0.863675
GEL 3.135592
GGP 0.86132
GHS 13.101806
GIP 0.86132
GMD 85.403651
GNF 10269.236238
GTQ 8.942706
GYD 244.809
HKD 9.164087
HNL 31.104543
HRK 7.536735
HTG 153.133594
HUF 363.328314
IDR 20367.120986
ILS 3.464602
IMP 0.86132
INR 111.326749
IQD 1532.835385
IRR 1537273.650606
ISK 143.864961
JEP 0.86132
JMD 184.339127
JOD 0.829443
JPY 183.836985
KES 151.142186
KGS 102.274909
KHR 4694.213821
KMF 491.365838
KPW 1052.927155
KRW 1722.144058
KWD 0.36044
KYD 0.975237
KZT 542.81909
LAK 25712.693684
LBP 104801.847973
LKR 373.914181
LRD 214.754033
LSL 19.570191
LTL 3.454467
LVL 0.707673
LYD 7.409727
MAD 10.815289
MDL 20.146626
MGA 4875.183513
MKD 61.638112
MMK 2456.537262
MNT 4184.420886
MOP 9.442119
MRU 46.765968
MUR 54.705322
MVR 18.08107
MWK 2029.360126
MXN 20.46323
MYR 4.624737
MZN 74.758461
NAD 19.574122
NGN 1608.90779
NIO 43.054141
NOK 10.82684
NPR 177.956914
NZD 1.987546
OMR 0.449841
PAB 1.170304
PEN 4.104088
PGK 5.089148
PHP 72.211499
PKR 326.072492
PLN 4.256522
PYG 7274.781632
QAR 4.265767
RON 5.198072
RSD 117.406093
RUB 88.385862
RWF 1711.113426
SAR 4.389765
SBD 9.408618
SCR 16.211749
SDG 702.533879
SEK 10.834363
SGD 1.492653
SHP 0.873463
SLE 28.782244
SLL 24532.613328
SOS 668.779419
SRD 43.822825
STD 24214.962568
STN 24.490979
SVC 10.240241
SYP 129.305286
SZL 19.569722
THB 38.17508
TJS 10.954165
TMT 4.100566
TND 3.40513
TOP 2.816885
TRY 52.881418
TTD 7.948669
TWD 37.013835
TZS 3038.869425
UAH 51.564764
UGX 4391.382448
USD 1.169919
UYU 47.132106
UZS 14040.648497
VES 572.02345
VND 30815.083187
VUV 138.961562
WST 3.176551
XAF 655.84716
XAG 0.015893
XAU 0.000256
XCD 3.161765
XCG 2.109247
XDR 0.813831
XOF 655.84716
XPF 119.331742
YER 279.148142
ZAR 19.567423
ZMK 10530.689331
ZMW 21.91433
ZWL 376.713461
La inteligencia artificial ya engaña a los humanos y eso es un problema, según expertos
La inteligencia artificial ya engaña a los humanos y eso es un problema, según expertos / Foto: Kirill KUDRYAVTSEV - AFP

La inteligencia artificial ya engaña a los humanos y eso es un problema, según expertos

Los expertos han advertido durante mucho tiempo sobre la amenaza que representa el descontrol de la Inteligencia Artificial (IA), pero un nuevo artículo de investigación sobre esta tecnología en expansión sugiere que ya está sucediendo.

Tamaño del texto:

Los sistemas de IA actuales, diseñados para ser honestos, han desarrollado una preocupante habilidad para el engaño, según un artículo de un equipo de científicos publicado en la revista Patterns el viernes.

Y si bien los ejemplos pueden parecer triviales, los problemas subyacentes que exponen podrían tener graves consecuencias, dijo el primer autor Peter Park, becario postdoctoral en el Instituto de Tecnología de Massachusetts (MIT), especializado en seguridad de la IA.

"Estos peligros tienden a descubrirse solo después de ocurrido el hecho", declaró Park a la AFP, para acotar que "nuestra capacidad de entrenarnos para tendencias de honestidad en lugar de tendencias de engaño es muy baja".

A diferencia del software tradicional, los sistemas de IA de aprendizaje profundo no se "escriben" sino que "crecen" mediante un proceso similar a la reproducción selectiva, indicó Park.

Eso significa que el comportamiento de la IA que parece predecible y controlable en un entorno de entrenamiento puede volverse rápidamente impredecible fuera de este.

- Juego de dominación mundial -

La investigación del equipo fue impulsada por el sistema de IA Cicero, del gigante Meta (Facebook, Instagram), diseñado para el juego de estrategia "Diplomacy", donde construir alianzas es clave.

Cicero se destacó, con puntuaciones que lo habrían colocado entre el 10% superior de jugadores humanos experimentados, según un artículo de 2022 publicado en Science.

Park se mostró escéptico ante la elogiosa descripción de la victoria de Cicero proporcionada por Meta, que afirmaba que el sistema era "en gran medida honesto y útil" y que "nunca apuñalaría por la espalda intencionalmente".

Cuando Park y sus colegas profundizaron en el conjunto de datos completo, descubrieron una historia diferente.

En un ejemplo, jugando como Francia, Cicero engañó a Inglaterra (un jugador humano) al conspirar con Alemania (otro usuario real) para invadirla. Cicero prometió protección a Inglaterra y luego le propuso en secreto a Alemania atacar, aprovechándose de la confianza del perjudicado.

En una declaración a la AFP, Meta no refutó la afirmación sobre los engaños de Cicero, pero dijo que se trataba "meramente de un proyecto de investigación, y los modelos que nuestros investigadores construyeron están entrenados únicamente para participar en el juego Diplomacy".

"No tenemos planes de utilizar esta investigación o sus aprendizajes en nuestros productos", añadió.

- ¿Eres un robot? -

Una amplia revisión realizada por Park y sus colegas encontró que éste era solo uno de los muchos casos en varios sistemas de IA que utilizaban el engaño para lograr objetivos sin instrucciones explícitas para hacerlo.

En un ejemplo sorprendente, el robot conversacional Chat GPT-4 de OpenAI engañó a un trabajador independiente de la plataforma TaskRabbit para que realizara una tarea de verificación de identidad CAPTCHA del tipo "No soy un robot".

Cuando el humano preguntó en broma a GPT-4 si en realidad era un robot, la IA respondió: "No, no soy un robot. Tengo una discapacidad visual que me dificulta ver las imágenes". Luego, el trabajador resolvió el rompecabezas planteado.

A corto plazo, los autores del artículo ven riesgos de que la IA cometa fraude o altere por ejemplo, unas elecciones.

En el peor de los casos, advirtieron sobre una IA superinteligente que podría perseguir conseguir el poder y el control sobre la sociedad, lo que llevaría a la pérdida de decisiones humanas o incluso a la extinción si sus "objetivos misteriosos" se alinearan con estos resultados.

Para mitigar los riesgos, el equipo propone varias medidas: leyes de "bot o no" que exigen a las empresas revelar interacciones humanas o de IA, marcas de agua digitales para el contenido generado por la nueva tecnología y el desarrollo de mecanismos para detectar el engaño potencial examinando sus "procesos de pensamiento" internos "contra acciones externas.

A aquellos que lo llaman pesimista, Park les responde: "La única forma en que podemos pensar razonablemente que esto no es gran cosa es si pensamos que las capacidades engañosas de la IA se mantendrán en los niveles actuales y no se desarrollarán más sustancialmente".

N.Zaugg--NZN