
-
Una explosión en una planta de acero en Pensilvania deja dos muertos y diez heridos
-
El banco BBVA anuncia que mantiene su OPA sobre su competidor español Sabadell
-
Encuentran los restos de un investigador británico desaparecido en la Antártida hace 66 años
-
Un muerto en los numerosos incendios forestales que asolan España
-
El Mundial de Rugby femenino contará con protectores bucales luminosos en caso de golpe en la cabeza
-
El fondo soberano noruego anuncia la venta de sus participaciones en 11 empresas israelíes
-
AOL apagará sus últimos módems de internet a finales de septiembre
-
Giacomo Raspadori, nuevo jugador del Atlético de Madrid
-
Luz verde de la federación española a la disputa del Villarreal-Barcelona en Miami
-
La mayoría de mercados asiáticos sube tras la prórroga de la tregua arancelaria entre EEUU y China
-
Inundaciones en el Himalaya de India habrían dejado al menos 70 muertos
-
Sinner y Sabalenka, los número uno, avanzan a octavos de Cincinnati
-
Trump espera una cumbre "constructiva" con Putin, bajo la mirada de la UE y Ucrania
-
Taylor Swift anuncia su duodécimo álbum en "pre-preventa"
-
Víctimas de pornografía en IA ven a Hong Kong mal preparada ante esa amenaza
-
Atleta italiano muere en los Juegos Mundiales en China
-
Científicos hallan fósil de mamífero de la era de los dinosaurios en la Patagonia chilena
-
Trump prolonga 90 días la tregua arancelaria con China
-
Trump espera una cumbre "constructiva" con Putin bajo la lupa de Ucrania y Europa
-
La ONU condena la muerte de seis periodistas en un bombardeo israelí en Gaza
-
Trump despliega la guardia nacional en Washington contra la delincuencia
-
¿Qué hace que la capital de EEUU sea especial?
-
El príncipe Enrique y Meghan Markle firman acuerdo reducido con Netflix
-
Trump confirma que Nvidia pagará a EEUU por sus ventas en China
-
Juez de EEUU rechaza solicitud del gobierno de publicar transcripciones de cómplice de Epstein
-
Trump ordena despliegue de la guardia nacional en Washington contra la delincuencia
-
En un típico pueblo estadounidense, Trump divide a los vecinos
-
Zelenski y dirigentes de la UE hablarán con Trump antes de su reunión con Putin
-
Miguel Uribe Turbay, promesa de la derecha colombiana víctima de la violencia política
-
Sin pan, sin gasolina, sin dólares: malestar en Bolivia a días de elección
-
Sonia Bermúdez sustituye a Montse Tomé como seleccionadora de España
-
El ejército nigeriano mata a más de 100 criminales en un operativo
-
Finlandia acusa a tres marineros de un petrolero por sabotear cables en el mar Báltico
-
La presencia de medusas paraliza la mayor central nuclear de Francia
-
Sigue vivo en España el incendio en la zona de unas minas romanas Patrimonio Mundial de la Unesco
-
Japón urge a millones a evacuar tras lluvias que provocaron inundaciones y aludes
-
Muere el presidenciable colombiano Miguel Uribe, baleado hace dos meses
-
El Gobierno español exige a un ayuntamiento que anule una moción que dificulta las festividades musulmanas
-
Funeral de cinco periodistas de Al Jazeera muertos en un bombardeo israelí en Gaza
-
Una masacre en los exteriores de una discoteca deja ocho muertos en Ecuador
-
Advierten en la ONU de "una nueva calamidad" ante el plan de Israel para Gaza
-
Muere Kunishige Kamamoto, considerado el mejor delantero del fútbol japonés
-
India ordena capturar decenas de miles de perros callejeros en Nueva Delhi
-
Jóvenes chinas rescatan del olvido una antigua escritura secreta usada entre mujeres
-
Greta Thunberg anuncia una nueva flotilla para llevar ayuda a Gaza
-
Con poesía y cantos, Omán busca preservar un idioma antiguo
-
Muere el aspirante presidencial baleado hace dos meses en Colombia
-
Corea del Norte advierte de "medidas contundentes" ante las maniobras de EEUU y el Sur
-
Colisionan navíos chinos al perseguir un barco filipino en un mar disputado
-
El Parlamento de Venezuela respalda a Maduro y denuncia una nueva "agresión" de EEUU

El riesgo de alimentar la inteligencia artificial con datos generados por el propio sistema
Los modelos de inteligencia artificial (IA) se abastecen sin parar de datos generados por la propia IA, lo que desemboca en la creación de contenidos cada vez más incoherentes, un problema que ya han señalado varios estudios científicos.
Los modelos en los que se basan las herramientas de IA generativa, como ChatGPT, que permiten crear todo tipo de contenidos con simples preguntas, necesitan ser ejercitados con un nombre colosal de datos.
Estos datos a menudo vienen de internet, que cada vez contiene más imágenes y textos creados por la propia IA.
Esta autoalimentación de la IA lleva a un deterioro de los modelos, que producen respuestas que van siendo cada vez menos originales y pertinentes y acaban por no tener ningún sentido, según un artículo publicado a finales de julio por la revista científica Nature.
Con el uso de este tipo de datos, llamados "datos sintéticos" porque están generados artificialmente, la muestra en la que se basan los modelos de IA para dar respuestas va perdiendo calidad.
- Como las vacas locas -
Investigadores de las Universidades de Rice y de Stanford, en Estados Unidos, llegaron a la misma conclusión analizando los modelos de IA generadores de imágenes Midjourney, Dall-E y Stable Diffusion.
Los estudios mostraron que las imágenes generadas eran cada vez menos originales e iban incorporando elementos incoherentes a medida que se añadían datos "artificiales" en el modelo, y compararon este fenómeno con la enfermedad de las vacas locas.
Esta epidemia, surgida en el Reino Unido, empezó con el uso para alimentar a los bovinos de harinas animales, obtenidas a partir de partes no consumidas de restos vacunos o de cadáveres de animales contaminados.
Las empresas del sector de la IA utilizan a menudo "datos sintéticos" para alimentar a sus programas debido a su fácil acceso, su abundancia y el bajo coste, comparado con datos creados por humanos.
Estas "fuentes de datos humanos sin explotar, de alta calidad" son cada vez más minoritarias, explica a AFP Jathan Sadowski, investigador especializado en las nuevas tecnologías de la Universidad de Monash, en Australia.
"Sin ningún control durante varias generaciones", la peor hipótesis sería que la degradación de los modelos "envenene la calidad y la diversidad de los datos en todo internet", advierte Richard Baraniuk, uno de los autores del artículo de la Universidad de Rice, en un comunicado.
Así como la crisis de las vacas locas hundió la industria cárnica en los años 1990, un internet repleto de contenidos hechos con IA y de modelos descontrolados podría amenazar el futuro del sector, en pleno auge, según los científicos.
"La verdadera pregunta para los investigadores y las empresas que construyen los sistemas de IA es: ¿cuándo el uso de los datos sintéticos es demasiado?", dice Sadowski.
- "Basura" -
Para otros especialistas, no obstante, el problema es exagerado.
Anthropic y Hugging Face, dos líderes del sector que afirman tener en cuenta el lado ético de la tecnología, confirman a AFP utilizar datos generados por la IA.
El artículo de la revista Nature presenta una perspectiva teórica interesante, pero poco realista, según Anton Lozhkov, ingeniero en aprendizaje automático en Hugging Face.
"El entrenamiento [de los modelos] en varias series de datos sintéticos es algo que simplemente no se hace en realidad", asegura.
Lozhkov admite sin embargo que los expertos de la IA se sienten frustrados ante la situación en que se encuentra internet.
"Una gran parte de internet es una basura", dice, y agrega que su empresa ha hecho grandes esfuerzos para limpiar este tipo de datos, suprimiendo a veces hasta un 90% de contenido.
M.Qasim--SF-PST