
-
Canadá anuncia intenção de reconhecer Estado palestino em setembro
-
Milhões de pessoas voltam para casa após fim de alertas de tsunami no Pacífico
-
Canadá tem intenção de reconhecer Estado palestino na Assembleia Geral da ONU
-
Tata Motors vai comprar Iveco Group por US$ 4,4 bilhões
-
Trump chega a acordo com Coreia do Sul e ameaça Índia com tarifas de 25%
-
Defesa Civil de Gaza relata 30 mortos por disparos israelenses
-
Trump oficializa ameaça de tarifas de 50% ao Brasil, mas com exceções
-
TikTok lança nos EUA ferramenta de verificação de informações pela comunidade
-
Swiatek, Keys e Osaka avançam à terceira rodada do WTA 1000 de Montreal
-
Shelton e Rublev avançam para a 3ª rodada do Masters 1000 de Toronto
-
Milhões de pessoas são evacuadas por risco de tsunami no Pacífico
-
Trump oficializa ameaça de tarifas de 50% ao Brasil
-
Celta de Vigo contrata atacante Bryan Zaragoza por empréstimo do Bayern de Munique
-
Fed mantém taxas inalteradas apesar da oposição de dois governadores e de Trump
-
Keys e Osaka avançam à terceira rodada do WTA 1000 de Montreal
-
EUA sanciona frota comercial vinculada a governantes do Irã
-
Fifa se diz aberta a negociar com sindicato FIFPro, mas descarta 'monopólio'
-
De Paul chega ao Inter Miami motivado para 'jogar com o melhor do mundo'
-
Kamala Harris não irá se candidatar ao governo da Califórnia
-
EUA impõe sanções econômicas ao ministro Alexandre de Moraes
-
PF cumpre mandado na sede da CBF em investigação sobre crime eleitoral
-
O último adeus a Ozzy Osbourne em Birmingham
-
Artistas e cientistas reproduzem rosto de mulher pré-histórica
-
EUA e Índia lançam satélite de observação terrestre
-
Defesa Civil de Gaza relata 14 mortos por disparos israelenses
-
Wirtz marca seu 1º gol pelo Liverpool em amistoso no Japão
-
AFA e River Plate criticam medida de Milei que aumenta impostos sobre clubes
-
Economia do México cresceu 1,2% no 2º trimestre entre ameaças de tarifas dos EUA
-
O último adeus dos milhares de fãs a Ozzy Osbourne em Birmingham
-
Trump ameaça Índia com tarifas de 25% a partir de 1º de agosto
-
Ex-treinadora da seleção canadense suspensa por espionagem assume time da Nova Zelândia
-
Granit Xhaka deixa Bayer Leverkusen e volta à Premier League pelo Sunderland
-
Os últimos acontecimentos da guerra em Gaza
-
China quer superar EUA no setor da inteligência artificial
-
Tailândia e Camboja se acusam mutuamente de violar a trégua
-
Como as tarifas de Trump impactarão o cobre chileno?
-
Bicampeã olímpica de biatlo tem morte confirmada 2 dias após acidente em montanha no Paquistão
-
PIB dos EUA cresceu 3% no 2º trimestre, melhor que o esperado
-
Cinco produtos ameaçados pelas próximas tarifas de Trump
-
Bayern de Munique anuncia contratação do atacante colombiano Luis Díaz
-
Gaza, vista do céu, é um território submerso na escuridão
-
China desarticula organização criminosa que vendia bonecas Labubu falsificadas
-
Cidade britânica de Birmingham se despede de Ozzy Osbourne
-
PIB da zona do euro cresceu 0,1% no 2T, mas tensões comerciais afetam a perspectiva
-
Terremoto de magnitude 8,8 na Rússia dispara alertas de tsunami no Pacífico
-
Kate Middleton assina 'miniexposição' em museu de Londres
-
Ataque armado de gangues em funeral deixa sete mortos na Guatemala
-
Brasil goleia Uruguai (5-1) e vai enfrentar Colômbia na final da Copa América feminina
-
Alertas de tsunami são emitidos no Pacífico após forte tremor no litoral russo
-
Países árabes se somam a pedido de desarmamento do Hamas

IA aprende a mentir, manipular e ameaçar seus criadores
Os últimos modelos de inteligência artificial (IA) generativa não se conformam mais em cumprir ordens. Começam a mentir, manipular e ameaçar para alcançar seus objetivos, diante dos olhares preocupados dos pesquisadores.
Ameaçado em ser desconectado, Claude 4, recém-criado pela Anthropic, chantageou um engenheiro e ameaçou revelar uma relação extraconjugal.
Por sua vez, o o1, da OpenAI, tentou se baixar em servidores externos e quando flagrado, negou.
Não é preciso se aprofundar na literatura ou no cinema: a IA que emula o comportamento humano já é uma realidade.
Para Simon Goldstein, professor da Universidade de Hong Kong, a razão para estas reações é o surgimento recente dos chamados modelos de "raciocínio", capazes de trabalhar por etapas em vez de produzir uma resposta instantânea.
O o1, versão inicial deste tipo da OpenAI, lançada em dezembro, "foi o primeiro que se comportou desta maneira", explica Marius Hobbhahn, encarregado da Apollo Research, que põe à prova grandes programas de IA generativa (LLM).
Estes programas também tendem, às vezes, a simular um "alinhamento", ou seja, dão a impressão de que seguem as instruções de um programador, quando na verdade buscam outros objetivos.
Por enquanto, estes traços se manifestam quando os algoritmos são submetidos a cenários extremos por humanos, mas "a questão é se os modelos cada vez mais potentes tenderão a ser honestos ou não", afirma Michael Chen, do organismo de avaliação METR.
"Os usuários também pressionam os modelos o tempo todo", diz Hobbhahn. "O que estamos vendo é um fenômeno real. Não estamos inventando nada".
Muitos internautas falam nas redes sociais de "um modelo que mente para eles ou inventa coisas. E não se tratam de alucinações, mas de duplicidade estratégica", insiste o cofundador da Apollo Research.
Embora Anthropic e OpenAI recorram a empresas externas, como a Apollo, para estudar seus programas, "uma maior transparência e um acesso maior" da comunidade científica "permitiriam investigar melhor para compreender e prevenir a farsa", sugere Chen, do METR.
Outro obstáculo: a comunidade acadêmica e as organizações sem fins lucrativos "dispõem de infinitamente menos recursos informáticos que os atores da IA", o que torna "impossível" examinar grandes modelos, assinala Mantas Mazeika, do Centro para a Segurança da Inteligência Artificial (CAIS).
As regulamentações atuais não estão desenhadas para enfrentar estes novos problemas.
Na União Europeia, a legislação se centra principalmente em como os humanos usam os modelos de IA, não em prevenir que os modelos se comportem mal.
Nos Estados Unidos, o governo de Donald Trump não quer nem ouvir falar em regulamentação, e o Congresso americano poderia, inclusive, proibir em breve que os estados regulem a IA.
- A IA no banco dos réus? -
"Por enquanto há muito pouca conscientização", diz Simon Goldstein, que, no entanto, avalia que o tema passará ao primeiro plano nos próximos meses com a revolução dos agentes de IA, interfaces capazes de realizar sozinhas uma multiplicidade de tarefas.
Os engenheiros estão em uma corrida atrás da IA e suas aberrações, com resultado duvidoso, em um contexto de forte concorrência.
A Anthropic pretende ser mais virtuosa que suas concorrentes, "mas está tentando idealizar um novo modelo para superar a OpenAI", segundo Goldstein. O ritmo dá pouco tempo para comprovações e correções.
"Como estão as coisas, as capacidades [da IA] estão se desenvolvendo mais rápido que a compreensão e a segurança", admite Hobbhahn, "mas ainda estamos em condições de nos atualizarmos".
Alguns apontam na direção da interpretabilidade, ciência que consiste em decifrar, do lado de dentro, como funciona um modelo de IA generativa, embora muitos, como o diretor do Centro para a Segurança da IA (CAIS), Dan Hendrycks, se mostrem céticos.
As trapaças da IA "poderiam obstaculizar a adoção caso se multipliquem, o que supõe um forte incentivo para que as empresas [do setor] resolvam" este problema, afirma Mazeika.
Goldstein, por sua vez, menciona o recurso aos tribunais para enquadrar a IA, dirigindo-se às empresas caso se desviem do caminho. Mas ele vai além, ao propor que os agentes da IA sejam "legalmente responsabilizados" em caso "de acidente ou delito".
K.AbuTaha--SF-PST