-
Ataque a tiros em universidade dos EUA deixa 2 mortos e 8 em estado crítico
-
Gabriel Jesus brilha em vitória do líder Arsenal; Liverpool vence e alivia crise
-
Gabriel Jesus brilha em vitória ao líder Arsenal; Liverpool vence e alivia crise
-
Bayer Leverkusen bate Colônia e volta a vencer no Campeonato Alemão
-
PSG vence lanterna Metz e sobe para liderança do Francês
-
Civil e soldados americanos morrem em emboscada na Síria
-
Com 2 de Raphinha, Barcelona vence Osasuna e segue firme na ponta do Espanhol
-
Flamengo vence Pyramids (2-0) e vai à decisão da Copa Intercontinental
-
EUA retira acusações contra ex-executivo argentino da Fox vinculado ao Fifagate
-
Belarus liberta líder da oposição Maria Kolesnikova e Nobel da Paz Ales Bialiatsky
-
Liverpool vence Brighton e alivia crise; Chelsea bate Everton
-
A odisseia de María Corina Machado para sair da Venezuela
-
Visita de Messi a estádio na Índia termina com tumulto entre torcedores
-
Onda de criminalidade impulsiona ultradireitista à presidência do Chile
-
Onda de criminalidade impulsiona ultradirestista à presidência do Chile
-
Enviado dos EUA se reunirá com Zelensky e líderes europeus em Berlim
-
Camboja fecha passagens de fronteira com Tailândia devido a confrontos mortais
-
Europa tem políticas migratórias mais seletivas e fronteiras menos permeáveis
-
EUA revela detalhes da ordem de apreensão de petroleiro na costa da Venezuela
-
Junta militar birmanesa nega ter matado civis no bombardeio de um hospital
-
Enviado especial dos EUA se reunirá com Zelensky e líderes europeus neste fim de semana em Berlim
-
Camboja acusa Tailândia de novos bombardeios após trégua anunciada por Trump
-
Opositora venezuelana Corina Machado apoia maior pressão sobre Maduro
-
Democratas publicam fotos de Epstein com Trump, Bill Clinton e Woody Allen
-
Juiz da Bolívia condena ex-presidente Arce a 5 meses de prisão preventiva
-
ELN ordena confinamento de civis na Colômbia ante ameaças de Trump
-
Nantes é goleado na visita ao Angers (4-1) e segue na zona de rebaixamento do Francês
-
Union Berlin vence Leipzig (3-1), que pode perder vice-liderança do Alemão
-
Charles III anuncia que tratamento contra o câncer será reduzido em 2026
-
Flamengo enfrenta Pyramids, de Mostafa Zico, em busca de vaga na final do Intercontinental
-
Esquerda convoca protestos contra redução da pena de Bolsonaro
-
Democratas publicam fotos de Epstein com Trump, Clinton e Woody Allen
-
EUA suspende sanções contra ministro do STF Alexandre de Moraes
-
Trump diz que Tailândia e Camboja concordaram em encerrar combates
-
Cuba admite 'impacto direto' após apreensão de petroleiro na Venezuela
-
Presença de governadores e prefeitos colombianos em Washington provoca reação de Petro
-
Novo chefe assume Comando Sul dos EUA para América Latina e Caribe
-
Guerrilha ELN ordena confinamento de civis na Colômbia ante ameaças de Trump
-
Irã prende Narges Mohammadi, ganhadora do Nobel da Paz
-
Guatemala se desculpa por desaparecimento forçado de ativistas indígenas em 1989
-
Salah é relacionado para jogo do Liverpool contra o Brighton
-
Lula fala por telefone com Maduro sobre 'paz' na América do Sul
-
F1 visita Barranquilla para avaliar possibilidade de sediar GP, diz prefeito
-
Messi vai inaugurar estátua de 21 metros de altura em sua homenagem na Índia
-
Espanha pede que UE mantenha veto à venda de carros com motor à combustão a partir de 2035
-
Taylor Swift chora em documentário ao lembrar do assassinato de meninas na Inglaterra
-
Plano dos EUA contempla adesão da Ucrânia à UE em 2027
-
Mohammed Ben Sulayem é reeleito presidente da FIA
-
Ruanda está levando região da África Oriental para a guerra, diz EUA na ONU
-
Jara x Kast, duas visões da mulher e da sociedade no Chile
IA aprende a mentir, manipular e ameaçar seus criadores
Os últimos modelos de inteligência artificial (IA) generativa não se conformam mais em cumprir ordens. Começam a mentir, manipular e ameaçar para alcançar seus objetivos, diante dos olhares preocupados dos pesquisadores.
Ameaçado em ser desconectado, Claude 4, recém-criado pela Anthropic, chantageou um engenheiro e ameaçou revelar uma relação extraconjugal.
Por sua vez, o o1, da OpenAI, tentou se baixar em servidores externos e quando flagrado, negou.
Não é preciso se aprofundar na literatura ou no cinema: a IA que emula o comportamento humano já é uma realidade.
Para Simon Goldstein, professor da Universidade de Hong Kong, a razão para estas reações é o surgimento recente dos chamados modelos de "raciocínio", capazes de trabalhar por etapas em vez de produzir uma resposta instantânea.
O o1, versão inicial deste tipo da OpenAI, lançada em dezembro, "foi o primeiro que se comportou desta maneira", explica Marius Hobbhahn, encarregado da Apollo Research, que põe à prova grandes programas de IA generativa (LLM).
Estes programas também tendem, às vezes, a simular um "alinhamento", ou seja, dão a impressão de que seguem as instruções de um programador, quando na verdade buscam outros objetivos.
Por enquanto, estes traços se manifestam quando os algoritmos são submetidos a cenários extremos por humanos, mas "a questão é se os modelos cada vez mais potentes tenderão a ser honestos ou não", afirma Michael Chen, do organismo de avaliação METR.
"Os usuários também pressionam os modelos o tempo todo", diz Hobbhahn. "O que estamos vendo é um fenômeno real. Não estamos inventando nada".
Muitos internautas falam nas redes sociais de "um modelo que mente para eles ou inventa coisas. E não se tratam de alucinações, mas de duplicidade estratégica", insiste o cofundador da Apollo Research.
Embora Anthropic e OpenAI recorram a empresas externas, como a Apollo, para estudar seus programas, "uma maior transparência e um acesso maior" da comunidade científica "permitiriam investigar melhor para compreender e prevenir a farsa", sugere Chen, do METR.
Outro obstáculo: a comunidade acadêmica e as organizações sem fins lucrativos "dispõem de infinitamente menos recursos informáticos que os atores da IA", o que torna "impossível" examinar grandes modelos, assinala Mantas Mazeika, do Centro para a Segurança da Inteligência Artificial (CAIS).
As regulamentações atuais não estão desenhadas para enfrentar estes novos problemas.
Na União Europeia, a legislação se centra principalmente em como os humanos usam os modelos de IA, não em prevenir que os modelos se comportem mal.
Nos Estados Unidos, o governo de Donald Trump não quer nem ouvir falar em regulamentação, e o Congresso americano poderia, inclusive, proibir em breve que os estados regulem a IA.
- A IA no banco dos réus? -
"Por enquanto há muito pouca conscientização", diz Simon Goldstein, que, no entanto, avalia que o tema passará ao primeiro plano nos próximos meses com a revolução dos agentes de IA, interfaces capazes de realizar sozinhas uma multiplicidade de tarefas.
Os engenheiros estão em uma corrida atrás da IA e suas aberrações, com resultado duvidoso, em um contexto de forte concorrência.
A Anthropic pretende ser mais virtuosa que suas concorrentes, "mas está tentando idealizar um novo modelo para superar a OpenAI", segundo Goldstein. O ritmo dá pouco tempo para comprovações e correções.
"Como estão as coisas, as capacidades [da IA] estão se desenvolvendo mais rápido que a compreensão e a segurança", admite Hobbhahn, "mas ainda estamos em condições de nos atualizarmos".
Alguns apontam na direção da interpretabilidade, ciência que consiste em decifrar, do lado de dentro, como funciona um modelo de IA generativa, embora muitos, como o diretor do Centro para a Segurança da IA (CAIS), Dan Hendrycks, se mostrem céticos.
As trapaças da IA "poderiam obstaculizar a adoção caso se multipliquem, o que supõe um forte incentivo para que as empresas [do setor] resolvam" este problema, afirma Mazeika.
Goldstein, por sua vez, menciona o recurso aos tribunais para enquadrar a IA, dirigindo-se às empresas caso se desviem do caminho. Mas ele vai além, ao propor que os agentes da IA sejam "legalmente responsabilizados" em caso "de acidente ou delito".
K.AbuTaha--SF-PST