-
El Mundial 2026 aterriza en EEUU con una inauguración hollywoodense
-
La FIFA rebautiza estadios del Mundial para ocultar marcas comerciales ajenas
-
Cinco momentos clave de SpaceX: desde el lanzamiento de Starship a su megacohete
-
Irán y EEUU ven cerca un acuerdo de paz
-
Canadá toma el testigo de México con histórico empate, turno para EEUU
-
David Beckham recibe su estrella en el Paseo de la Fama de Hollywood
-
Presidente federación palestina de fútbol no obtiene visa para ir al Mundial
-
¿Tatuarse a De la Fuente? Iglesias y Oyarzabal, el ying y el yang de la Roja
-
La encrucijada mundialista de Kendry Páez
-
"La veo favorita", dice Grimaldo sobre España en el Mundial (entrevista AFP)
-
Juez de EEUU rechaza recurso para detener retiro del nombre "Trump" del Kennedy Center
-
Irán y Pakistán ven "cerca" un acuerdo con EEUU pese a divergencias con Trump
-
Caótico fin de la visita del papa, que vuelve a Roma en el avión del rey de España
-
Musk se convierte en el primer billonario del mundo al dispararse las acciones de SpaceX
-
El Barça inicia acciones legales contra Florentino Pérez por "calumnias"
-
Irán afirma que un acuerdo con EEUU "nunca ha estado tan cerca"
-
La rivalidad con China planeará en la cumbre del G7 en Francia
-
Pueblos y minas fantasmas en Venezuela tras operación militar contra las mafias
-
La IA toma el relevo del Pulpo Paul en las predicciones mundialistas
-
Cuba pretende ampliar las actividades para las empresas privadas de la isla
-
Los estadounidenses ansiosos pero con signos de optimismo ante el 250º aniversario de su país
-
Las autoridades de Tigré niegan estar planeando una nueva guerra civil en Etiopía
-
La OIT adopta el primer convenio internacional sobre trabajadores de plataformas digitales
-
Venezuela alerta sobre un nuevo derrame de petróleo desde Trinidad y Tobago
-
Venezuela otorga una licencia a la británica Shell para explotación gasífera
-
SpaceX despega en la bolsa en un debut récord
-
Un estudio destaca los probables efectos positivos de la política antiobesidad en Chile
-
Un tribunal de EEUU permite aplicar el arancel global del 10% de Trump
-
"Nunca tuve acceso a la casa" de Maradona, dice un acusado en el juicio por su muerte
-
Despiden a la niña cuyo presunto asesinato conmocionó a Francia
-
El candidato izquierdista de Colombia, dispuesto a revisar la política de paz de Petro
-
El fenómeno El Niño ya comenzó y puede alcanzar una intensidad récord
-
Protestas y choques con la policía: la otra cara del inicio del Mundial en México
-
Revuelo político en Argentina por confesión de jefe de gabinete de que ocultó dinero
-
Russell lidera los primeros ensayos en el GP de Barcelona de F1
-
La inflación en Brasil sube en mayo pese a las medidas de Lula para contener los combustibles
-
La OIT adopta primer convenio internacional sobre trabajadores de plataformas digitales
-
Macron recibirá a Meloni el 25 de junio para su primera cumbre franco-italiana
-
Un grupo vinculado a Irán dice haber hackeado drones del FBI
-
Feliz cumpleaños, señor presidente: Trump celebrará sus 80 años con pelea de UFC
-
David Hockney en seis obras emblemáticas
-
El papa vuelve a defender a los migrantes desde Canarias y les llama a integrarse
-
El expresidente surcoreano Yoon, condenado a 30 años de cárcel por el envío de drones a Corea del Norte
-
Investigan por fraude fiscal al exdirigente español Zapatero por las joyas halladas en un registro
-
El cohete espacial insignia de Japón despega exitosamente con seis satélites a bordo
-
La epidemia de ébola sigue extendiéndose en RD Congo, advierte la OMS
-
A los 91 años, un periodista argentino va por su 18° Mundial
-
El guerrillero más buscado de Colombia está "desesperado", dice el ministro de Defensa
-
El sismo en Filipinas deja 46 muertos, los rescatistas desafían la lluvia y las réplicas
-
SpaceX sale a bolsa con la esperanza de romper todos los récords
El riesgo de alimentar la inteligencia artificial con datos generados por el propio sistema
Los modelos de inteligencia artificial (IA) se abastecen sin parar de datos generados por la propia IA, lo que desemboca en la creación de contenidos cada vez más incoherentes, un problema que ya han señalado varios estudios científicos.
Los modelos en los que se basan las herramientas de IA generativa, como ChatGPT, que permiten crear todo tipo de contenidos con simples preguntas, necesitan ser ejercitados con un nombre colosal de datos.
Estos datos a menudo vienen de internet, que cada vez contiene más imágenes y textos creados por la propia IA.
Esta autoalimentación de la IA lleva a un deterioro de los modelos, que producen respuestas que van siendo cada vez menos originales y pertinentes y acaban por no tener ningún sentido, según un artículo publicado a finales de julio por la revista científica Nature.
Con el uso de este tipo de datos, llamados "datos sintéticos" porque están generados artificialmente, la muestra en la que se basan los modelos de IA para dar respuestas va perdiendo calidad.
- Como las vacas locas -
Investigadores de las Universidades de Rice y de Stanford, en Estados Unidos, llegaron a la misma conclusión analizando los modelos de IA generadores de imágenes Midjourney, Dall-E y Stable Diffusion.
Los estudios mostraron que las imágenes generadas eran cada vez menos originales e iban incorporando elementos incoherentes a medida que se añadían datos "artificiales" en el modelo, y compararon este fenómeno con la enfermedad de las vacas locas.
Esta epidemia, surgida en el Reino Unido, empezó con el uso para alimentar a los bovinos de harinas animales, obtenidas a partir de partes no consumidas de restos vacunos o de cadáveres de animales contaminados.
Las empresas del sector de la IA utilizan a menudo "datos sintéticos" para alimentar a sus programas debido a su fácil acceso, su abundancia y el bajo coste, comparado con datos creados por humanos.
Estas "fuentes de datos humanos sin explotar, de alta calidad" son cada vez más minoritarias, explica a AFP Jathan Sadowski, investigador especializado en las nuevas tecnologías de la Universidad de Monash, en Australia.
"Sin ningún control durante varias generaciones", la peor hipótesis sería que la degradación de los modelos "envenene la calidad y la diversidad de los datos en todo internet", advierte Richard Baraniuk, uno de los autores del artículo de la Universidad de Rice, en un comunicado.
Así como la crisis de las vacas locas hundió la industria cárnica en los años 1990, un internet repleto de contenidos hechos con IA y de modelos descontrolados podría amenazar el futuro del sector, en pleno auge, según los científicos.
"La verdadera pregunta para los investigadores y las empresas que construyen los sistemas de IA es: ¿cuándo el uso de los datos sintéticos es demasiado?", dice Sadowski.
- "Basura" -
Para otros especialistas, no obstante, el problema es exagerado.
Anthropic y Hugging Face, dos líderes del sector que afirman tener en cuenta el lado ético de la tecnología, confirman a AFP utilizar datos generados por la IA.
El artículo de la revista Nature presenta una perspectiva teórica interesante, pero poco realista, según Anton Lozhkov, ingeniero en aprendizaje automático en Hugging Face.
"El entrenamiento [de los modelos] en varias series de datos sintéticos es algo que simplemente no se hace en realidad", asegura.
Lozhkov admite sin embargo que los expertos de la IA se sienten frustrados ante la situación en que se encuentra internet.
"Una gran parte de internet es una basura", dice, y agrega que su empresa ha hecho grandes esfuerzos para limpiar este tipo de datos, suprimiendo a veces hasta un 90% de contenido.
M.Qasim--SF-PST