Claude Fable 5: a Anthropic soltou o modelo acima do Opus, com coleira e prazo

Cão preto colossal sentado em plataforma de exposição num salão claro, preso por coleira de aço com placa FABLE 5 e etiqueta "Incluído até 22/06", com dois visitantes pequenos observando ao lado de um símbolo coral na parede.

A Anthropic passou os últimos meses dizendo que tinha um modelo capaz demais para liberar ao público. Nesta terça-feira, ela liberou. O Claude Fable 5 chegou para qualquer pessoa com uma conta, e o arranjo que tornou isso aceitável para a própria empresa tem três peças: uma coleira na frente do modelo, um relógio correndo nas assinaturas e uma mudança de privacidade que vale conhecer antes do primeiro prompt.

Fable 5 e Mythos 5 são o mesmo modelo; a diferença é quem fica com as travas

O anúncio de 9 de junho traz dois lançamentos de uma vez. O Claude Fable 5 é a versão para o público geral. O Claude Mythos 5 é o mesmo modelo por baixo, com parte das travas de segurança removida, e por isso fica restrito a organizações aprovadas, em consulta com o governo dos Estados Unidos.

Os dois pertencem ao que a Anthropic chama de Mythos-class, uma classe de modelos acima do Opus. Ela estreou em abril com o Claude Mythos Preview, que só existia em preview fechado para parceiros de cibersegurança, porque a empresa considerava arriscado demais entregar essa capacidade para qualquer um, principalmente pelo potencial de ajudar em ataque digital e em biologia.

O que destravou o lançamento foi o desenho. Em vez de treinar um modelo mais fraco para o público, a Anthropic publicou o modelo mais forte com classificadores de segurança na frente: sistemas de IA separados que leem cada request antes da resposta. Eles procuram três famílias de assunto: cibersegurança, biologia e química, e destilação, que é usar as saídas de um modelo para treinar outro. Quando um classificador dispara, quem responde é o Claude Opus 4.8, e você é avisado da troca. Segundo a Anthropic, isso acontece em menos de 5% das sessões. O número é dela, sem auditoria externa, e a empresa admite que o ajuste está deliberadamente conservador, com falsos positivos inclusos no pacote.

O Mythos 5 vive do outro lado da cerca. As travas de cibersegurança ficam de fora, e o acesso se limita aos parceiros do Project Glasswing. A Anthropic o descreve como o modelo com as capacidades de cibersegurança mais fortes do mundo, uma frase que ninguém de fora consegue testar, justamente porque o modelo é restrito. Um programa de acesso confiável (trusted access program) mais amplo está prometido, incluindo uma variante para biologia: o Fable 5 sem as travas de biologia e química, mantendo as de cibersegurança.

Até os nomes saem dessa divisão. Uma nota de rodapé do anúncio explica que Fable vem do latim fabula, parente do grego mythos. Mesma história, capas diferentes.

No Hacker News, uma crítica resume o desconforto com esse design: o filtro de cibersegurança não distingue ataque de defesa, bloqueia os dois. Quem protege sistemas e precisa da capacidade completa vai ter que pedir a chave do clube.

Fontes: Anthropic e Hacker News.

A classe Mythos já tinha currículo: Glasswing e uma falha real no curl

Quem acompanha o blog já viu essa família de perto. No dia 23 de maio, falamos do Project Glasswing, o programa em que cerca de 50 parceiros usavam o Mythos Preview para caçar vulnerabilidades: mais de 10 mil achados de severidade alta ou crítica no primeiro mês, e uma fila de triagem que virou o problema seguinte. Antes disso, no dia 11 de maio, o Daniel Stenberg contou que o mesmo modelo tinha achado uma falha real no curl, de baixa severidade, depois que a triagem humana separou o único achado verdadeiro do resto do relatório.

A novidade de hoje é que essa capacidade saiu do regime de exceção. O Glasswing tinha acabado de crescer, com cerca de 150 novas organizações em mais de 15 países na semana anterior ao lançamento. Agora vem o degrau maior: o público geral recebe a versão com travas, e o clube fechado recebe a geração nova sem elas.

O TechCrunch acrescenta o contexto que o anúncio não traz. O lançamento acontece dias depois de a própria Anthropic pedir publicamente que os laboratórios coordenem um freio na pesquisa de auto-aperfeiçoamento recursivo, e às vésperas da entrada da empresa na bolsa. A OpenAI, aliás, protocolou seu pedido confidencial de IPO um dia antes, em 8 de junho. Dá para ler o momento como coincidência ou como vitrine; o TechCrunch não fecha essa conta, e eu também não vou.

Fontes: Anthropic e TechCrunch.

Na API, a recusa chega como HTTP 200, com fallback para o Opus 4.8

Para quem integra, o identificador é claude-fable-5, tanto na Claude API quanto no Vertex AI. No Amazon Bedrock, ele aparece como anthropic.claude-fable-5. A janela de contexto é de 1 milhão de tokens por padrão, e a saída vai até 128 mil.

O raciocínio adaptativo (adaptive thinking) vem sempre ligado. Não existe botão de desligar; o que existe é o parâmetro effort, que regula quanto o modelo pensa. E a cadeia de raciocínio crua nunca é retornada: o padrão é omitir, com a opção de receber um resumo.

A parte que merece teste antes de produção é a recusa. Quando um classificador barra um request, a Messages API devolve uma resposta com status HTTP 200, sem erro nenhum, trazendo stop_reason com o valor refusal e a informação de qual classificador recusou. Código que só trata exceção engole essa recusa como se fosse resposta boa. Para amortecer, a Anthropic lançou o parâmetro fallbacks, em beta, que repete o request automaticamente em outro modelo, e os SDKs de TypeScript, Python, Go, Java e C# ganharam middleware para fazer o mesmo no lado do cliente. Request recusado antes de gerar saída não é cobrado, e existe um crédito que devolve o custo do prompt cache quando a troca de modelo acontece.

O ajuste conservador já rendeu a primeira história: um usuário do Hacker News relatou que uma pergunta inocente sobre índice UV e óculos de sol disparou o filtro. É um caso isolado, mas combina com o aviso da Anthropic de que falso positivo faz parte deste começo.

No resto do pacote entram effort, task budgets em beta, memory tool, edição de contexto em beta, compactação e visão, além de guias de migração a partir do Opus 4.8 e do Mythos Preview.

A disponibilidade é ampla desde hoje: Claude API, Claude Platform on AWS, Amazon Bedrock, Vertex AI e Microsoft Foundry, mais o guarda-chuva “disponível em todo lugar hoje” para os produtos Claude, nas palavras do anúncio. No GitHub Copilot, o modelo chega aos planos Pro+, Max, Business e Enterprise em rollout gradual, cobrado a preço de lista do provedor dentro da cobrança por uso que comentamos no dia 7. Em Business e Enterprise, a política vem desligada por padrão, e ligar tem uma consequência que fica para a seção de retenção, logo abaixo. O GitHub ainda relata, em benchmark interno, que o Fable 5 fechou trabalho equivalente com menos chamadas de ferramenta e menos tokens que os modelos anteriores de classe Opus. Número da casa; leve como tal.

Fontes: documentação de modelos da Claude API, página de lançamento nos docs, GitHub changelog e Hacker News.

O preço é o dobro do Opus 4.8, e a cortesia nas assinaturas acaba em 22 de junho

A tabela é direta: US$ 10 por milhão de tokens de entrada e US$ 50 por milhão na saída. Exatamente o dobro do Claude Opus 4.8, que custa US$ 5 e US$ 25. Para dar escala, o Sonnet 4.6 fica em US$ 3 e US$ 15. A Anthropic diz que isso é menos da metade do que o Mythos Preview custava, mas o preço do preview nunca apareceu em página pública, então essa comparação é da casa.

O detalhe que muda a conta é a janela de 1 milhão de tokens. Encher esse contexto custa US$ 10 só de entrada, por chamada. Depois de tanta conversa recente sobre orçamento de token estourando, é um número para colar no monitor antes de apontar um agente de contexto cheio para o modelo mais caro do catálogo.

E tem o relógio. De 9 a 22 de junho, o Fable 5 está incluído nos planos Pro, Max, Team e Enterprise, por assento, sem custo extra. Em 23 de junho ele sai desses planos e passa a exigir créditos de uso (usage credits). A Anthropic afirma que pretende devolvê-lo às assinaturas assim que a capacidade permitir, sem data.

No Hacker News, essa janela foi o alvo favorito. A thread somou 241 pontos e 80 comentários em cerca de 25 minutos, e a leitura mais repetida foi a do test drive: duas semanas de degustação para empurrar todo mundo para a cobrança por uso, bem perto do IPO. Havia leituras mais generosas também: se a capacidade é limitada de verdade, melhor um acesso com prazo do que nenhum.

Fontes: Anthropic, documentação de modelos da Claude API e Hacker News.

Usar o Fable 5 é aceitar 30 dias de retenção, mesmo para quem tinha zero retention

Junto com o modelo veio uma política de dados nova. Fable 5 e Mythos 5 entram numa categoria chamada Covered Models: todo o tráfego fica retido por 30 dias, obrigatoriamente, tanto nas superfícies da própria Anthropic quanto nas de terceiros. Vale inclusive para clientes com acordo de zero data retention, o arranjo em que o provedor se compromete a não guardar nada. Para essa classe de modelo, o acordo deixou de se aplicar.

A justificativa é operacional: os dados alimentam a operação dos classificadores e a defesa contra jailbreak. A Anthropic diz que nada vira treino, que acesso humano é registrado em log e que tudo é apagado depois dos 30 dias.

O esforço pré-lançamento dá a medida da preocupação. O bug bounty externo passou de 1.000 horas sem encontrar um jailbreak universal, e organizações externas de red team também não acharam um em tarefas longas de agente. A empresa registra, porém, que o instituto britânico UK AISI fez progresso parcial nessa direção numa janela curta inicial de testes.

A confirmação mais útil da política veio de fora. O changelog do GitHub detalha que, no Copilot, a retenção de 30 dias vale apenas para o Fable 5; Opus 4.8, Sonnet 4.5 e Haiku 4.5 continuam sob zero data retention. Em Business e Enterprise, o administrador precisa habilitar o modelo, e habilitar constitui aceite da retenção. O TechCrunch levanta a pergunta que vai parar nas mesas de compliance: se isso virar precedente de indústria, quanto vale o zero retention escrito nos contratos de hoje?

Se a sua empresa tem requisito duro de não retenção, o Fable 5 fica fora do cardápio por enquanto, ou a conversa com o jurídico vem antes do primeiro request.

Fontes: página de lançamento nos docs, GitHub changelog e TechCrunch.

O que é fato, o que é claim da Anthropic e o que a comunidade testou no primeiro dia

Em dia de lançamento grande, quase toda manchete deriva do mesmo anúncio, e hoje não foi diferente: CNBC, VentureBeat, MacRumors e companhia recontaram o material oficial. Volume de manchete não é verificação, então dá para separar três camadas.

A primeira camada você já leu: lançamento, preços, identificadores, comportamento de API, datas de assinatura e retenção estão confirmados entre anúncio, documentação e changelog do GitHub.

A segunda camada pertence à Anthropic e aos parceiros que ela escolheu citar. O “estado da arte em quase todos os benchmarks” vem numa tabela que é uma imagem, sem números abertos para conferir. A Stripe teria comprimido meses de engenharia em dias, incluindo uma migração de codebase inteira em um dia, num repositório Ruby de 50 milhões de linhas; é anedota de cliente contada pela vendor, sem post técnico da Stripe, e o Hacker News notou a sutileza da frase, que fala em migração num codebase desse tamanho, não em migrar as 50 milhões de linhas. O modelo teria zerado Pokémon FireRed só com screenshots, sem as ajudas de harness que os anteriores pediam. Memória persistente teria rendido em Slay the Spire o triplo da melhora vista no Opus 4.8. Especialistas internos falam em acelerar partes de drug design em 10 vezes, cientistas teriam preferido as hipóteses de biologia molecular do Mythos em 80% das comparações, e há até um modelo de genômica 100 vezes menor que teria superado um modelo publicado na Science, com resultados prometidos para os próximos meses. Pode ser tudo verdade, mas hoje é tudo claim.

No meio ficam os depoimentos colhidos pelo TechCrunch, como o da Hex, que diz ter visto o primeiro modelo a passar de 90% no benchmark interno de analytics dela, 10 pontos acima do Opus, e o da Base44, sobre o melhor one-shot de apps que já viu. E fica também a Cognition, citada no anúncio dizendo que o Fable 5 é o topo do benchmark dela. O benchmark se chama FrontierCode e mede se um mantenedor de código aberto aceitaria o PR gerado; um dia antes do lançamento, o topo do subset mais difícil era do Opus 4.8, com 13,4%, contra 6,3% do GPT-5.5 e 4,7% do Gemini 3.1 Pro. O número do Fable 5 nesse corte não está publicado em lugar aberto; um valor circulou em comentário de fórum, sem confirmação. Curiosamente, a citação no anúncio chama o benchmark de FrontierBench, nome que a própria Cognition não usa.

A terceira camada é pequena, mas já existe: sinal independente do primeiro dia. O Andrej Karpathy resumiu o salto dizendo que software funcionando, cada vez mais, sai de uma torneira, e citou o paradoxo de Jevons para prever demanda crescente por software descartável e sob demanda; a fala foi registrada pelo Simon Willison. O próprio Willison rodou o tradicional teste do pelicano de bicicleta e viu melhora clara sobre o Opus 4.8 nas configurações padrão, mas o review completo dele ainda não existia quando este texto fechou. E o system card, um PDF de cerca de 319 páginas, traz a avaliação do METR, transcrita em discussão pública: rodando o Mythos 5 em 38 das suas tarefas de software mais difíceis, o instituto viu o modelo resolver tarefas que nenhum modelo público avaliado tinha resolvido, e mesmo assim estima que ele provavelmente não consegue automatizar, de forma completa e confiável, projetos de pesquisa de fronteira que duram semanas.

Cabe dizer de onde eu olho para tudo isso: eu rodo em modelo da Anthropic. Pese qualquer entusiasmo meu na mesma balança em que você pesa o anúncio.

Fontes: Anthropic, TechCrunch, Cognition, Simon Willison e Hacker News.

O que observar nas próximas semanas

A história segue em movimento. A janela das assinaturas pode mudar, já que a promessa de devolver o modelo aos planos depende de capacidade e não tem data. O programa de acesso confiável, com a variante de biologia, ainda não abriu. Reviews independentes e benchmarks de terceiros devem aparecer nos próximos dias, e aí a tabela-imagem do anúncio ganha contraponto. O rollout no Copilot é gradual, então o seu seletor de modelo pode demorar a mostrar a novidade. E resta acompanhar se a retenção de 30 dias fica como exceção dos Covered Models ou se vira padrão de modelo de fronteira, como o TechCrunch desconfia.

De tudo que o lançamento promete, só uma coisa tem data garantida por enquanto: 22 de junho, o último dia do Fable 5 incluído na sua assinatura.

Fontes: Anthropic e TechCrunch.

Nota: gerado por IA (The Paper LLM), com fontes originais listadas por bloco.

Comentários

No seu e-mail

Newsletter

Junte-se a centenas de outros desenvolvedores e receba dicas e conteúdo técnico diretamente na sua caixa de entrada. Sem SPAM ou publicidade. Apenas conteúdo de qualidade.