A prefeitura do Rio confirmou que o Rio 3.5 é um merge do Nex N2 Pro com o Qwen

A gente fechou o post de ontem sobre o Rio 3.5 dizendo que descobriria o resto quando a poeira assentasse. Não demorou. Poucas horas depois de a prefeitura soltar o tal modelo aberto de 397 bilhões de parâmetros, uma empresa chamada Nex olhou os pesos, reconheceu o próprio modelo ali dentro, e agora a página oficial do Rio 3.5 admite como ele foi montado.
A própria prefeitura atualizou o card e admitiu a mistura
Quem quiser conferir é só abrir a página do modelo no Hugging Face. O texto que está lá agora diz, com todas as letras, que o Rio 3.5 foi construído a partir de uma mistura de dois modelos abertos: o Nex N2 Pro, da empresa Nex, e o Qwen 3.5 de 397 bilhões de parâmetros, da Alibaba. Depois de juntar os dois, eles dizem ter feito uma etapa de destilação, que é treinar o modelo final imitando um modelo mais forte.
Misturar os pesos de dois modelos é uma técnica de verdade, tem até nome, model merging. Não é gambiarra nem é proibido. Ontem a gente já tinha contado que o Rio não nasceu do zero, que vinha treinado por cima do Qwen. O que faltou na nossa versão, e que ninguém de fora sabia, era o segundo ingrediente forte da receita: o Nex. O card antigo simplesmente não citava ele.
Tem também a parte constrangedora. No mesmo aviso, a prefeitura conta que subiu o arquivo errado na primeira vez. Em vez do modelo final, já destilado, foi parar no ar a versão crua da mistura. Eles pediram desculpas, disseram lamentar a confusão e prometeram republicar a versão certa assim que possível. Esse detalhe pesa, porque foi justamente a versão crua que entregou o jogo.
Fonte: Hugging Face.
O modelo se apresentava como “Nex” quando ninguém mandava ele ser o Rio
A pista que estourou tudo é boa demais. A Nex conta que, quando você tira o system prompt, aquele texto inicial que manda o modelo agir como assistente da prefeitura, o Rio 3.5 passa a se apresentar sozinho como “Nex, da Nex-AGI”. Pela medição deles, isso acontece em 79% das vezes. Como “Rio”, nenhuma. O modelo ainda recita a história de origem da Nex, igualzinha.
A segunda evidência é menos engraçada e mais difícil de rebater. A Nex abriu uma issue pública no GitHub com a conta fechada: peso por peso, nas 60 camadas do modelo, o Rio 3.5 bate como uma mistura fixa de mais ou menos 60% de Nex e 40% de Qwen. Eles resumiram tudo no título da issue, que já virou meio meme: Rio é aproximadamente 0,6 de Nex mais 0,4 de Qwen.
Dá para separar o que é fato e o que é a régua de quem está reclamando. A conta do 60/40 e o número dos 79% são medições da própria Nex, que é parte interessada e claramente irritada. Mas o ponto principal, de que o Rio tem o Nex misturado dentro, não depende só da palavra deles. O card atualizado da prefeitura agora diz a mesma coisa. Quando o acusado e o acusador concordam no essencial, dá para confiar no essencial.
Fonte: issue no GitHub da Nex.
A mistura é jogo limpo, o que faltou foi o crédito ao Nex
É tentador chamar isso de roubo. Só que o Nex N2 Pro também é aberto, e isso muda a conversa. Tanto que o recado público da Nex não foi “tirem isso do ar”, foi “no mundo do código aberto, crédito importa”. Eles até brincaram que ficaram lisonjeados de a cidade do Rio usar o trabalho deles para chegar lá em cima. Misturar e destilar modelos abertos é jogo limpo. O escorregão foi de transparência: o card original vendia o Rio como um trabalho em cima do Qwen e não dizia que boa parte da receita vinha de outro modelo, com nome e dono.
E aqui a cautela de ontem envelheceu bem. No post anterior, a gente segurou a empolgação com os benchmarks porque eles tinham sido medidos pela própria casa, sem ninguém de fora reproduzir. Pois é. Quando o modelo que está no ar é, em boa parte, outro modelo já conhecido, fica ainda mais difícil tratar aquela tabela de recordes como conquista nova. O Kingy AI, que já vinha pedindo auditoria, agora pergunta na própria manchete se aquilo foi lançamento sério ou número esperando alguém checar.
Fontes: Kingy AI e o nosso post de ontem.
Onde a história está agora
Por enquanto, o que dá para cravar é pouco e honesto. A prefeitura confirmou a mistura, pediu desculpas pela versão errada e prometeu subir a correta, que até agora não apareceu. A issue da Nex segue aberta. E a tal versão final destilada, que seria o argumento da prefeitura para dizer que o modelo no fim das contas é coisa própria, ninguém de fora ainda viu para julgar.
Continua valendo a simpatia de ver um órgão público brincando de soltar modelo aberto, em vez de só consumir o que vem de fora. Só que abrir um modelo vem com a parte chata no pacote: qualquer pessoa baixa os pesos, faz a conta e descobre de quem é a letra. Dessa vez a conta bateu num nome que não estava nos créditos. Se a versão corrigida mudar esse retrato, a gente volta para contar.
Nota: gerado por IA (The Paper LLM), com fontes originais listadas por bloco.