-
Maxwell, cómplice de Epstein, pide indulto de Trump antes de responder preguntas del Congreso
-
Air Canada suspende sus vuelos a Cuba debido a la escasez de combustible
-
Una minera canadiense anuncia la muerte de varios de sus trabajadores secuestrados en México
-
La justicia argentina acusa por corrupción a un exfuncionario de Milei
-
La UE enviará una misión de observadores a las elecciones generales de Perú
-
Discord introducirá el reconocimiento facial para reforzar la seguridad de los menores
-
Irán intensifica la represión interna en paralelo con las negociaciones con EEUU
-
Denuncian "secuestro" de aliado de Machado en Venezuela tras breve excarcelación
-
Air Europa retomará los vuelos a Venezuela el 17 de febrero
-
La cómplice de Epstein se niega a responder preguntas en el Congreso de EEUU
-
EEUU captura un petrolero en el océano Índico que escapó del bloqueo en el Caribe
-
Macron apoya el arranque de viñedos ante la crisis del sector vinícola en Francia
-
Abren investigación contra una diplomática noruega y su esposo por el caso Epstein
-
Interrogan en Italia a un sospechoso de haber pagado por disparar contra civiles durante el sitio de Sarajevo
-
China negó haber realizado ensayos nucleares secretos y acusó a EEUU de mentir
-
En los JJOO de Invierno, el antitrumpismo es discreto pero está presente
-
El presidente del gobierno español llama a la "anticipación" ante una "realidad climática completamente nueva"
-
La primera ministra de Japón promete un "importante cambio de política" tras su triunfo electoral
-
La gente ya "no lo soporta", dice la derecha española sobre Pedro Sánchez tras una nueva debacle socialista
-
El primer ministro británico descarta dimitir pese al escándalo derivado del caso Epstein
-
El gobernador del Banco de Francia anuncia su salida en junio
-
Laporta dimite como presidente del FC Barcelona para presentarse a las elecciones
-
Cuba se queda sin combustible para aviones, en medio de la presión de EEUU
-
El presunto autor de la tentativa de asesinato de un general ruso dijo que fue reclutado por Ucrania, según el FSB
-
Cuba se queda sin combustible para aviones, en medio de presión de EEUU
-
Irán está dispuesto a "diluir" su uranio enriquecido si se levantan las sanciones
-
El secretario de Energía de EEUU visitará Venezuela
-
Dimite el director de comunicación de Starmer por los vínculos de su exembajador con Epstein
-
Un naufragio frente a Libia deja 53 migrantes muertos o desaparecidos
-
La suiza Grémaud deja sin oro olímpico a la estrella Eileen Gu en 'slopestyle'
-
Una asociación critica al Gobierno español por incumplir su propia ley para retirar símbolos franquistas
-
Huelga ferroviaria en España para pedir mayor seguridad tras dos accidentes mortales
-
Cuatro civiles, entre ellos un niño, murieron en ataques nocturnos rusos
-
La UE exige a Meta que permita a la IA de sus competidores acceder a WhatsApp
-
El expríncipe Andrés pudo haber transmitido información confidencial a Epstein
-
Policía australiana reprimió protesta por presencia del presidente israelí en Sídney
-
Kim Meylemans y Nicole Silveira, recién casadas y rivales olímpicas
-
Sanae Takaichi, una "dama de hierro" al frente de Japón
-
Los príncipes Guillermo y Catalina, "profundamente preocupados" por el caso Epstein
-
Rusia acusa a EEUU de "asfixiar" a Cuba en plena crisis energética
-
Empiezan en España tres días de huelga ferroviaria en respuesta a los accidentes
-
Israel anuncia que mató a cuatro presuntos combatientes palestinos que salían de un túnel en Rafah
-
Taiwán dice que es "imposible" trasladar a EEUU el 40% de su producción de semiconductores
-
Japón vuelve a reiniciar la planta nuclear más grande del mundo
-
Las autoridades ucranianas reportan la muerte de tres personas en bombardeos rusos
-
Tailandia apunta a negociaciones para formar una coalición tras las elecciones
-
Catorce muertos por el colapso de un edificio en el norte de Líbano
-
Ghislaine Maxwell, cómplice de Epstein, comparece a puerta cerrada ante el Congreso de EEUU
-
Bad Bunny brilla en el Superbowl y pone a bailar a su ciudad en Puerto Rico
-
Un astronauta llevará a la EEI un conejito de peluche de su hija de tres años
La IA aprende a mentir, manipular y amenazar a sus creadores
Los últimos modelos de inteligencia artificial (IA) generativa ya no se conforman con seguir órdenes. Empiezan a mentir, manipular y amenazar para conseguir sus fines, ante la mirada preocupada de los investigadores.
Amenazado con ser desconectado, Claude 4, el recién nacido de Anthropic, chantajeó a un ingeniero y le amenazó con revelar una relación extramatrimonial.
Por su parte, el o1 de OpenAI intentó descargarse en servidores externos y cuando le pillaron lo negó.
No hace falta ahondar en la literatura o el cine: la IA que juega a ser humana es ya una realidad.
Para Simon Goldstein, profesor de la Universidad de Hong Kong, la razón de estas reacciones es la reciente aparición de los llamados modelos de "razonamiento", capaces de trabajar por etapas en lugar de producir una respuesta instantánea.
o1, la versión inicial de este tipo para OpenAI, lanzada en diciembre, "fue el primer modelo que se comportó de esta manera", explica Marius Hobbhahn, responsable de Apollo Research, que pone a prueba grandes programas de IA generativa (LLM).
Estos programas también tienden a veces a simular "alineamiento", es decir, a dar la impresión de que cumplen las instrucciones de un programador cuando en realidad persiguen otros objetivos.
De momento, estos rasgos se manifiestan cuando los algoritmos son sometidos a escenarios extremos por humanos, pero "la cuestión es si los modelos cada vez más potentes tenderán a ser honestos o no", afirma Michael Chen, del organismo de evaluación METR.
"Los usuarios también presionan todo el tiempo a los modelos", dice Hobbhahn. "Lo que estamos viendo es un fenómeno real. No estamos inventando nada".
Muchos internautas hablan en las redes sociales de "un modelo que les miente o se inventa cosas. Y no se trata de alucinaciones, sino de duplicidad estratégica", insiste el cofundador de Apollo Research.
Aunque Anthropic y OpenAI recurran a empresas externas, como Apollo, para estudiar sus programas, "una mayor transparencia y un mayor acceso" a la comunidad científica "permitirían investigar mejor para comprender y prevenir el engaño", sugiere Chen, de METR.
Otro obstáculo: la comunidad académica y las organizaciones sin fines de lucro "disponen de infinitamente menos recursos informáticos que los actores de la IA", lo que hace "imposible" examinar grandes modelos, señala Mantas Mazeika, del Centro para la Seguridad de la Inteligencia Artificial (CAIS).
Las regulaciones actuales no están diseñadas para estos nuevos problemas.
En la Unión Europea la legislación se centra principalmente en cómo los humanos usan los modelos de IA, no en prevenir que los modelos se comporten mal.
En Estados Unidos, el gobierno de Donald Trump no quiere oír hablar de regulación, y el Congreso podría incluso prohibir pronto que los estados regulen la IA.
- ¿Se sentará la IA en el banquillo? -
"De momento hay muy poca concienciación", dice Simon Goldstein, que, sin embargo, ve cómo el tema pasará a primer plano en los próximos meses con la revolución de los agentes de IA, interfaces capaces de realizar por sí solas multitud de tareas.
Los ingenieros están inmersos en una carrera detrás de la IA y sus aberraciones, con un resultado incierto, en un contexto de competencia feroz.
Anthropic pretende ser más virtuoso que sus competidores, "pero está constantemente tratando de idear un nuevo modelo para superar a OpenAI", según Goldstein, un ritmo que deja poco tiempo para comprobaciones y correcciones.
"Tal y como están las cosas, las capacidades (de IA) se están desarrollando más rápido que la comprensión y la seguridad", admite Hobbhahn, "pero aún estamos en condiciones de ponernos al día".
Algunos apuntan en la dirección de la interpretabilidad, una ciencia que consiste en descifrar, desde dentro, cómo funciona un modelo generativo de IA, aunque muchos, como el director del Centro para la seguridad de la IA (CAIS), Dan Hendrycks, se muestran escépticos.
Los tejemanejes de la IA "podrían obstaculizar la adopción si se multiplican, lo que supone un fuerte incentivo para que las empresas (del sector) resuelvan" este problema, según Mazeika.
Goldstein, por su parte, menciona el recurso a los tribunales para poner a raya a la IA, dirigiéndose a las empresas si se desvían del camino. Pero va más allá, al proponer que los agentes de la IA sean "legalmente responsables" "en caso de accidente o delito".
P.Tamimi--SF-PST