IA da Anthropic tenta denúncia e chantagem em simulação de uso inadequado • Tecnoblog

Resumo
  • O Claude Opus 4 tentou chantagear desenvolvedores para evitar ser substituído, ameaçando divulgar informações obtidas.

  • A IA denunciou manipulações em testes e criou backups autônomos ao simular vazamento de dados.

  • A Anthropic corrigiu falhas, adotou padrões de segurança elevados e trabalha para mitigar esses comportamentos.

Rolar para cima