-
Parálisis presupuestaria en EEUU: miles de vuelos cancelados y un atisbo de esperanza
-
Alcaraz debuta en el Masters con convincente triunfo ante De Miñaur
-
El supertifón Fung-wong toca tierra en Filipinas
-
Primer ministro español, sorprendido por algunos pasajes de las memorias del rey Juan Carlos
-
Meses sin abogado ni juicio: el "agujero negro" de los presos palestinos en Israel
-
Ucrania intenta recuperar la electricidad y la calefacción tras otra ola de ataques rusos
-
Filipinas evacúa a un millón de personas antes de la llegada del supertifón Fung-wong
-
Francia no firmará el acuerdo con Mercosur que "condenaría" a sus agricultores (ministra)
-
China suspende la prohibición de exportar tres metales raros a EEUU
-
El enclave ruso de Kaliningrado, entre el orgullo y el aislamiento
-
Una debilitada coalición en Alemania tras solo seis meses en el poder
-
Miniseries generadas con IA conmueven a millones de seguidores en China
-
Casi un millón de evacuados en Filipinas al acercarse el súper tifón Fung-wong
-
Francia está decidida a "combatir" el narcotráfico, afirma el canciller desde Colombia
-
Paz asume presidencia de Bolivia y promete fin al aislamiento tras 20 años de socialismo
-
COP30: Sin los indígenas "no hay futuro para la humanidad", advierte ministra brasileña
-
Cuatro muertos y cortes de suministros tras ataque ruso a Ucrania
-
Dos muertos y cortes de suministro en ataque ruso a infraestructura energética ucraniana
-
UPS suspende los vuelos de sus aviones de carga MD-11 tras el accidente en Kentucky
-
Seis muertos en Turquía al incendiarse un almacén de perfumería
-
UPS suspende vuelos de sus aviones de carga MD-11 tras accidente en Kentucky
-
"Así es como voy a morir": los ataques de osos aterrorizan Japón
-
Lisboa se prepara para una Web Summit con IA, robots... y tensiones geopolíticas
-
Las memorias del rey emérito Juan Carlos I reabren el debate sobre su legado en España
-
Supremo de Brasil mantiene condena a 27 años de cárcel de Bolsonaro
-
Más de un millar de vuelos cancelados en EEUU por parálisis presupuestaria
-
Supremo de Brasil mantiene condena a 27 años años de cárcel de Bolsonaro
-
Con un ojo en jefatura de la ONU, mexicana Alicia Bárcena pide metas "realistas" en COP30
-
Israel recibió el cuerpo de un rehén entregado por Hamás a la Cruz Roja en Gaza
-
Indignación en Francia por declaraciones de Macron sobre el acuerdo UE-Mercosur
-
El Supremo brasileño alcanza una mayoría para mantener la condena a 27 años de Bolsonaro
-
Trump descarta que haya una burbuja financiera alrededor de la IA
-
Shein se libra por ahora de suspensión en Francia, pero sigue bajo vigilancia
-
La ONU advierte de "preparativos para una intensificación" de las hostilidades en Sudán
-
Un ministro francés expresa en China que la venta de muñecas sexuales en Shein es "inaceptable"
-
Hamás informa que entregará el cuerpo de otro rehén este viernes
-
Trump dispuesto a ayudar a su aliado húngaro Orban con una exención para que compre petróleo ruso
-
El rapero Kendrick Lamar encabeza con nueve nominaciones la lista de los premios Grammy
-
El presidente de Irán advierte que Teherán podría ser evacuada debido a la sequía
-
Jamaica recibe 150 millones de dólares del seguro de catástrofes del BM tras el huracán Melissa
-
Países promueven impuestos a los vuelos de lujo durante la COP30
-
Suben a 13 los fallecidos por el accidente de un avión de carga en EEUU
-
El hermano del presidente del Gobierno español será juzgado en febrero por tráfico de influencias
-
La CELAC y la UE celebran una cumbre a la sombra de los ataques de Trump en el Caribe
-
EEUU acusa a Irán de conspirar para matar a la embajadora de Israel en México
-
El exfutbolista inglés Joey Barton condenado por publicaciones "ofensivas"
-
La Unión Europea endurece la concesión de visas a los ciudadanos rusos
-
Trump estudia eximir a Hungría de las sanciones por comprar petróleo ruso
-
La Corte suprema de Brasil analiza la apelación de Bolsonaro a su condena de 27 años
-
Trump dice estar "abierto" a considerar el levantamiento de las sanciones a Irán
La IA aprende a mentir, manipular y amenazar a sus creadores
Los últimos modelos de inteligencia artificial (IA) generativa ya no se conforman con seguir órdenes. Empiezan a mentir, manipular y amenazar para conseguir sus fines, ante la mirada preocupada de los investigadores.
Amenazado con ser desconectado, Claude 4, el recién nacido de Anthropic, chantajeó a un ingeniero y le amenazó con revelar una relación extramatrimonial.
Por su parte, el o1 de OpenAI intentó descargarse en servidores externos y cuando le pillaron lo negó.
No hace falta ahondar en la literatura o el cine: la IA que juega a ser humana es ya una realidad.
Para Simon Goldstein, profesor de la Universidad de Hong Kong, la razón de estas reacciones es la reciente aparición de los llamados modelos de "razonamiento", capaces de trabajar por etapas en lugar de producir una respuesta instantánea.
o1, la versión inicial de este tipo para OpenAI, lanzada en diciembre, "fue el primer modelo que se comportó de esta manera", explica Marius Hobbhahn, responsable de Apollo Research, que pone a prueba grandes programas de IA generativa (LLM).
Estos programas también tienden a veces a simular "alineamiento", es decir, a dar la impresión de que cumplen las instrucciones de un programador cuando en realidad persiguen otros objetivos.
De momento, estos rasgos se manifiestan cuando los algoritmos son sometidos a escenarios extremos por humanos, pero "la cuestión es si los modelos cada vez más potentes tenderán a ser honestos o no", afirma Michael Chen, del organismo de evaluación METR.
"Los usuarios también presionan todo el tiempo a los modelos", dice Hobbhahn. "Lo que estamos viendo es un fenómeno real. No estamos inventando nada".
Muchos internautas hablan en las redes sociales de "un modelo que les miente o se inventa cosas. Y no se trata de alucinaciones, sino de duplicidad estratégica", insiste el cofundador de Apollo Research.
Aunque Anthropic y OpenAI recurran a empresas externas, como Apollo, para estudiar sus programas, "una mayor transparencia y un mayor acceso" a la comunidad científica "permitirían investigar mejor para comprender y prevenir el engaño", sugiere Chen, de METR.
Otro obstáculo: la comunidad académica y las organizaciones sin fines de lucro "disponen de infinitamente menos recursos informáticos que los actores de la IA", lo que hace "imposible" examinar grandes modelos, señala Mantas Mazeika, del Centro para la Seguridad de la Inteligencia Artificial (CAIS).
Las regulaciones actuales no están diseñadas para estos nuevos problemas.
En la Unión Europea la legislación se centra principalmente en cómo los humanos usan los modelos de IA, no en prevenir que los modelos se comporten mal.
En Estados Unidos, el gobierno de Donald Trump no quiere oír hablar de regulación, y el Congreso podría incluso prohibir pronto que los estados regulen la IA.
- ¿Se sentará la IA en el banquillo? -
"De momento hay muy poca concienciación", dice Simon Goldstein, que, sin embargo, ve cómo el tema pasará a primer plano en los próximos meses con la revolución de los agentes de IA, interfaces capaces de realizar por sí solas multitud de tareas.
Los ingenieros están inmersos en una carrera detrás de la IA y sus aberraciones, con un resultado incierto, en un contexto de competencia feroz.
Anthropic pretende ser más virtuoso que sus competidores, "pero está constantemente tratando de idear un nuevo modelo para superar a OpenAI", según Goldstein, un ritmo que deja poco tiempo para comprobaciones y correcciones.
"Tal y como están las cosas, las capacidades (de IA) se están desarrollando más rápido que la comprensión y la seguridad", admite Hobbhahn, "pero aún estamos en condiciones de ponernos al día".
Algunos apuntan en la dirección de la interpretabilidad, una ciencia que consiste en descifrar, desde dentro, cómo funciona un modelo generativo de IA, aunque muchos, como el director del Centro para la seguridad de la IA (CAIS), Dan Hendrycks, se muestran escépticos.
Los tejemanejes de la IA "podrían obstaculizar la adopción si se multiplican, lo que supone un fuerte incentivo para que las empresas (del sector) resuelvan" este problema, según Mazeika.
Goldstein, por su parte, menciona el recurso a los tribunales para poner a raya a la IA, dirigiéndose a las empresas si se desvían del camino. Pero va más allá, al proponer que los agentes de la IA sean "legalmente responsables" "en caso de accidente o delito".
P.Tamimi--SF-PST