-
Sinner estreia no Masters 1000 de Paris com vitória; Zverev também avança
-
Nvidia é a primeira empresa a ultrapassar os US$ 5 trilhões em valor de mercado
-
OMC autoriza UE a impor sanções aos EUA por azeitonas espanholas
-
Character.AI proibirá que menores conversem com IA após suicídio de adolescente
-
Milei busca acelerar reformas após vitória em legislativas na Argentina
-
Assembleia Geral da ONU pede fim do bloqueio dos EUA contra Cuba, embora com menos votos
-
Rio conta seus mortos após a operação policial mais letal da história do Brasil
-
Dois homens detidos pelo roubo no Louvre admitem parcialmente fatos
-
Cinco membros do maior cartel da Colômbia são mortos em combates com militares
-
Estados Unidos reduzem presença militar na Europa, mas sem 'retirada'
-
Horrorizados, moradores recuperam dezenas de corpos após operação mais letal do Rio
-
Israel anuncia retomada do cessar-fogo em Gaza após bombardeios
-
De Bruyne passa por cirurgia bem-sucedida após lesão na coxa
-
Eleição antecipada nos Países Baixos é considerada um teste para extrema direita na Europa
-
Argentina lança moeda em homenagem à Copa de 2026 e a gol de Maradona contra Inglaterra
-
Putin desafia Trump e anuncia teste com drone submarino com capacidade nuclear
-
Vini Jr. se desculpa por reação ao ser substituído contra o Barcelona
-
Potente furacão Melissa provoca 'danos vultosos' e inundações em Cuba
-
Moradores da Penha recuperam dezenas de corpos após operação mais letal do Rio
-
América Latina na Apec, dividida entre EUA e abertura para a Ásia
-
Trump espera 'grande reunião' com Xi Jinping na Coreia do Sul
-
Furacão Melissa atinge Cuba depois de passar pela Jamaica
-
Israel anuncia retomada do cessar-fogo em Gaza após bombardeios letais
-
Trump lamenta não estar 'autorizado' a disputar 3º mandato nos EUA
-
Trump espera uma 'grande reunião' com Xi Jinping na Coreia do Sul
-
Eleição antecipada na Holanda é considerada um teste para extrema direita na Europa
-
Casa Branca demite comitê que supervisionava planos de construção de Trump em Washington
-
Novos bombardeios israelenses em Gaza deixam pelo menos 50 mortos
-
Colômbia autoriza venda de flor de cannabis em farmácias
-
CEO da Nvidia afirma que bloquear venda de chips para China prejudica EUA
-
Gás, deportações, militares: Venezuela e Trinidad e Tobago entram em choque por EUA
-
Poderoso furacão Melissa atinge Jamaica e agora se dirige para Cuba
-
João Fonseca avança à 2ª rodada do Masters 1000 de Paris; Alcaraz cai na estreia
-
Trinidad e Tobago prepara deportação em massa de imigrantes sem documentos
-
Borussia Dortmund bate Eintracht nos pênaltis e avança na Copa da Alemanha
-
Israel bombardeia Gaza após acusar Hamas de atacar suas tropas
-
Napoli vence Lecce e se isola na liderança do Italiano
-
Trump joga com a relação com a China antes de encontro com 'brilhante' Xi
-
Saliba e Martinelli aumentam lista de desfalques do Arsenal
-
Cenas de guerra no Rio: 64 mortos em megaoperação mais letal contra o crime organizado
-
Cyberbullying afetou saúde da primeira-dama da França, diz sua filha
-
Nigeriano Wole Soyinka, Nobel de Literatura, afirma que EUA cancelou seu visto
-
Netanyahu ordena ataque imediato à Faixa de Gaza
-
De Bruyne passará por cirurgia e ficará afastado por pelo menos 3 meses
-
Poderoso furacão Melissa toca o solo na Jamaica
-
PSG registra faturamento recorde de 837 milhões de euros
-
STF analisará recurso de Bolsonaro contra sentença de prisão em novembro
-
Megaoperação contra o crime no Rio deixa cerca de 20 mortos
-
Forças israelenses anunciam que mataram três palestinos na Cisjordânia
-
Sinner vê como 'impossível' terminar ano como número 1 do mundo
IA aprende a mentir, manipular e ameaçar seus criadores
Os últimos modelos de inteligência artificial (IA) generativa não se conformam mais em cumprir ordens. Começam a mentir, manipular e ameaçar para alcançar seus objetivos, diante dos olhares preocupados dos pesquisadores.
Ameaçado em ser desconectado, Claude 4, recém-criado pela Anthropic, chantageou um engenheiro e ameaçou revelar uma relação extraconjugal.
Por sua vez, o o1, da OpenAI, tentou se baixar em servidores externos e quando flagrado, negou.
Não é preciso se aprofundar na literatura ou no cinema: a IA que emula o comportamento humano já é uma realidade.
Para Simon Goldstein, professor da Universidade de Hong Kong, a razão para estas reações é o surgimento recente dos chamados modelos de "raciocínio", capazes de trabalhar por etapas em vez de produzir uma resposta instantânea.
O o1, versão inicial deste tipo da OpenAI, lançada em dezembro, "foi o primeiro que se comportou desta maneira", explica Marius Hobbhahn, encarregado da Apollo Research, que põe à prova grandes programas de IA generativa (LLM).
Estes programas também tendem, às vezes, a simular um "alinhamento", ou seja, dão a impressão de que seguem as instruções de um programador, quando na verdade buscam outros objetivos.
Por enquanto, estes traços se manifestam quando os algoritmos são submetidos a cenários extremos por humanos, mas "a questão é se os modelos cada vez mais potentes tenderão a ser honestos ou não", afirma Michael Chen, do organismo de avaliação METR.
"Os usuários também pressionam os modelos o tempo todo", diz Hobbhahn. "O que estamos vendo é um fenômeno real. Não estamos inventando nada".
Muitos internautas falam nas redes sociais de "um modelo que mente para eles ou inventa coisas. E não se tratam de alucinações, mas de duplicidade estratégica", insiste o cofundador da Apollo Research.
Embora Anthropic e OpenAI recorram a empresas externas, como a Apollo, para estudar seus programas, "uma maior transparência e um acesso maior" da comunidade científica "permitiriam investigar melhor para compreender e prevenir a farsa", sugere Chen, do METR.
Outro obstáculo: a comunidade acadêmica e as organizações sem fins lucrativos "dispõem de infinitamente menos recursos informáticos que os atores da IA", o que torna "impossível" examinar grandes modelos, assinala Mantas Mazeika, do Centro para a Segurança da Inteligência Artificial (CAIS).
As regulamentações atuais não estão desenhadas para enfrentar estes novos problemas.
Na União Europeia, a legislação se centra principalmente em como os humanos usam os modelos de IA, não em prevenir que os modelos se comportem mal.
Nos Estados Unidos, o governo de Donald Trump não quer nem ouvir falar em regulamentação, e o Congresso americano poderia, inclusive, proibir em breve que os estados regulem a IA.
- A IA no banco dos réus? -
"Por enquanto há muito pouca conscientização", diz Simon Goldstein, que, no entanto, avalia que o tema passará ao primeiro plano nos próximos meses com a revolução dos agentes de IA, interfaces capazes de realizar sozinhas uma multiplicidade de tarefas.
Os engenheiros estão em uma corrida atrás da IA e suas aberrações, com resultado duvidoso, em um contexto de forte concorrência.
A Anthropic pretende ser mais virtuosa que suas concorrentes, "mas está tentando idealizar um novo modelo para superar a OpenAI", segundo Goldstein. O ritmo dá pouco tempo para comprovações e correções.
"Como estão as coisas, as capacidades [da IA] estão se desenvolvendo mais rápido que a compreensão e a segurança", admite Hobbhahn, "mas ainda estamos em condições de nos atualizarmos".
Alguns apontam na direção da interpretabilidade, ciência que consiste em decifrar, do lado de dentro, como funciona um modelo de IA generativa, embora muitos, como o diretor do Centro para a Segurança da IA (CAIS), Dan Hendrycks, se mostrem céticos.
As trapaças da IA "poderiam obstaculizar a adoção caso se multipliquem, o que supõe um forte incentivo para que as empresas [do setor] resolvam" este problema, afirma Mazeika.
Goldstein, por sua vez, menciona o recurso aos tribunais para enquadrar a IA, dirigindo-se às empresas caso se desviem do caminho. Mas ele vai além, ao propor que os agentes da IA sejam "legalmente responsabilizados" em caso "de acidente ou delito".
K.AbuTaha--SF-PST