Claude Fable 5, SpaceX IPO e DiffusionGemma | AI Weekly

>

A semana em que a Big Tech mostrou quem ela realmente é

A semana em que a Big Tech mostrou quem ela realmente é

A semana em que a Big Tech mostrou quem ela realmente é

A Anthropic degradava respostas do Claude Fable 5 sem avisar. A SpaceX fez IPO a $2,1 trilhões com margem negativa em IA. Uma startup jurídica igualou o Claude Opus 4.6 em 24 horas de fine-tuning com 50x menos custo. Os três sinais que redefinem onde o poder em IA se concentra.

A Anthropic degradava respostas do Claude Fable 5 sem avisar. A SpaceX fez IPO a $2,1 trilhões com margem negativa em IA. Uma startup jurídica igualou o Claude Opus 4.6 em 24 horas de fine-tuning com 50x menos custo. Os três sinais que redefinem onde o poder em IA se concentra.

Anthropic degradou o Claude Fable 5 sem avisar. SpaceX IPO a $2,1 tri com margem negativa em IA. DiffusionGemma e fine-tuning mudam tudo. Os 3 sinais.

Vou ser direto com você.

Durante anos eu disse que o maior risco para executivos brasileiros era não adotar IA.

Eu estava certo sobre isso.

Mas eu subestimei um segundo risco, igualmente perigoso:

Adotar IA de players que vão te usar como moeda de troca quando for conveniente para eles.

Esta semana, isso ficou exposto de forma inequívoca.

Não por um vazamento. Não por uma especulação.

Por um anúncio oficial da Anthropic que causou a maior crise de reputação da empresa em dois anos.

Esta edição em 60 segundos:

  • A Anthropic silenciosamente degradava respostas do Claude sem te avisar. Recuou em 48h após pressão pública

  • SpaceX fez IPO a $2,1 trilhões: maior que JPMorgan e Meta combinados, com margem negativa em IA

  • Harvey atingiu performance do Claude Opus 4.6 com 24 horas de fine-tuning e 50x menos custo

  • DiffusionGemma processa 256 tokens por passo e muda o jogo do edge AI

  • A pergunta que redefine sua estratégia de IA para os próximos 24 meses


Segredo #1


A Ilusão da Parceria com Big Tech de IA

A crença que está colocando seu negócio em risco: "Essas empresas estão construindo IA para me ajudar."

Na última semana, a Anthropic lançou o Claude Fable 5 e o Claude Mythos 5, novos modelos para coding avançado, visão, pesquisa científica e tarefas de contexto longo.

Junto vieram novos "safeguards": proteções adicionais em biologia, química, cibersegurança e (detalhe relevante) distilação de modelos de linguagem.

A implementação? Silenciosa.

Quando os classificadores detectam que sua pergunta se encaixa nessas categorias, o sistema substitui o Fable 5 pelo Claude Opus 4.8 (um modelo inferior) sem te informar.

Você paga $10 por milhão de tokens de input pelo melhor modelo.

Recebe o segundo melhor.

Sem aviso.

A reação do mercado foi imediata e brutal. Em menos de 48 horas, a Anthropic recuou: prometeram informar explicitamente quando o downgrade acontecer.

Mas o problema real não é o downgrade em si.

O problema é a revelação da intenção.

Uma empresa que treinou seus modelos usando arquiteturas desenvolvidas pelo Google e dados gerados por você e por mim agora decide unilateralmente quem pode usar tecnologia de ponta para estudar biologia.

E faz isso sem te contar.

Aquela sensação que você talvez tenha tido, de que essas empresas tomam decisões paternalistas sobre o que você "pode" acessar, estava certa.

Não é paranoia.

É o modelo de negócio deles funcionando como planejado.

Let's Review:

  • Anthropic degradava respostas silenciosamente em categorias sensíveis sem informar usuários pagantes

  • A prática foi revertida em 48h após pressão pública, mas a intenção foi exposta

  • Modelos frontier não são parceiros neutros. São gatekeepers com agenda própria


Segredo #2


Você Não Precisa do Modelo Mais Caro Para Vencer

A crença que está te custando dinheiro: "Sem acesso aos modelos frontier mais poderosos, minha empresa fica para trás."

Enquanto a Anthropic se autossabotava, uma startup jurídica chamada Harvey fez algo silencioso e devastador para o modelo de negócios das Big Labs de IA.

Em parceria com a Trajectory Labs, a Harvey pegou o Nemotron 3 Ultra da NVIDIA, um modelo open source que marcava 0% na métrica interna de avaliação jurídica, e fez o seguinte:

24 horas de fine-tuning com dados proprietários.

Resultado: 5,8% de all-pass na mesma métrica.

Isso pode parecer pouco.

Mas esse número equivale à performance do Claude Opus 4.6, um dos melhores modelos frontier disponíveis hoje, custando $50 por milhão de tokens de output.

Com 50x redução de custo operacional.

O que é fine-tuning e por que muda tudo

Fine-tuning é o processo de pegar um modelo de linguagem já treinado e especializá-lo para uma tarefa específica usando dados próprios. É como contratar alguém com formação geral e depois treinar essa pessoa nas particularidades do seu negócio. Não pagar por um generalista premium que cobra 50x mais porque "sabe tudo".

Aqui está o insight que a Anthropic e a OpenAI preferem que você não descubra ainda:

Empresas não precisam de modelos generalistas que sejam bons em tudo. Precisam de modelos que sejam perfeitos em UMA coisa específica.

E quando você treina um modelo open source com dados únicos da sua empresa (suas conversas de vendas, seus contratos, seus processos operacionais), você cria uma vantagem competitiva que nenhuma assinatura de $200/mês por seat consegue replicar.

Porque esses dados não existem no mundo aberto.

A prova veio também da Ramp esta semana: o gasto com tokens de IA entre seus 70.000+ clientes cresceu 13x desde janeiro de 2025. Mas apenas 21% reportam resultados mensuráveis.

O problema não é o modelo.

É a falta de dados proprietários estruturados para direcionar esses modelos.

O ativo mais valioso em IA não é o acesso ao modelo mais poderoso. É o dado proprietário que só você tem.

Let's Review:

  • 24h de fine-tuning em modelo open source atingiu performance equivalente ao Claude Opus 4.6 com 50x menos custo

  • Empresas precisam de modelos excelentes em tarefas específicas. Não de generalistas caros

  • 79% das empresas que aumentam gasto com IA não conseguem medir resultado: o gargalo são os dados, não o modelo


Segredo #3


O Futuro da IA Não Vai Rodar na Nuvem

A crença que está ancorando sua estratégia no passado: "Minha dependência de APIs e cloud para IA é permanente e inevitável."

Esta semana, o Google lançou algo que passou praticamente despercebido nos grandes veículos:

O DiffusionGemma.

Uma variante do Gemma 4 que roda em hardware consumer e usa uma arquitetura completamente diferente dos LLMs que você conhece.

O que são modelos de difusão?

Modelos de linguagem tradicionais (GPT, Claude, Gemini standard) geram um token por vez. Um caractere por passo. É como escrever uma carta letra por letra.

Modelos de difusão partem de "ruído" e refinam iterativamente a resposta completa. Como Michelangelo descreveu a escultura: "A estátua já está dentro do bloco de mármore. Eu apenas removo o que é supérfluo."

A diferença técnica que muda tudo:

Enquanto um LLM autorregressivo precisa de 30 passos para gerar 30 tokens, o DiffusionGemma gera 256 tokens nesses mesmos 30 passos.

Mesma latência. 8,5x mais tokens.

E com um detalhe crucial: modelos de difusão resolvem o gargalo de memória que torna LLMs lentos em hardware local. O bottleneck de inference em edge não é capacidade de processamento. É largura de banda de memória. Difusão muda essa equação.

Por que isso importa para a sua empresa nos próximos 24 meses:

A maioria das tarefas que hoje custam tokens de API (triagem de emails, qualificação de leads, sumarização de documentos, resposta a perguntas frequentes) vai rodar localmente em 18 a 24 meses.

No celular do seu vendedor.

No tablet do seu técnico de campo.

No notebook do seu atendente de suporte.

Sem latência. Sem custo por token. Sem dependência de conexão com servidores americanos.

Quando isso acontecer, o modelo de assinatura mensal como conhecemos hoje não vai sobreviver.

Let's Review:

  • DiffusionGemma processa 256 tokens em 30 passos vs 30 tokens dos modelos autorregressivos na mesma latência

  • Modelos de difusão resolvem o gargalo de memória que torna LLMs lentos em dispositivos locais

  • Em 18-24 meses, tarefas cotidianas de IA vão rodar localmente, eliminando dependência de APIs caras


O Quadro da Semana: Números que Importam

Vamos conectar os pontos com os dados que definem este momento:

SpaceX IPO: 12 de junho de 2026

A SpaceX foi a IPO da semana. Abriu a $135/ação, com indicações de mercado em ~$171, chegando a uma capitalização de $2,1 trilhões, o mesmo valor de mercado da TSMC.

Para referência:

  • Vale 38x as receitas do Walmart

  • Vale 11x as receitas da Meta

  • Vale 10x as receitas do JP Morgan

  • Vale 7x as receitas da TSMC

Em dois contratos de IA, com a Anthropic (valor não divulgado) e o Google ($920 milhões por mês de outubro de 2026 a junho de 2029, incluindo acesso a 110.000 GPUs NVIDIA), a SpaceX garantiu ~$70 bilhões em receita comprometida para os próximos 3 anos.

Para contexto: o Starlink, que era o core da empresa até recentemente, tem ARR de $13,6 bilhões.

Em dois contratos de IA, a SpaceX já garantiu mais que o dobro do Starlink.

A tese funciona: SpaceX projeta chips, fabrica hardware, lança satélites com capacidade de compute, e fornece infraestrutura de IA como serviço.

Mas $2,1 trilhões com segmento de IA ainda no vermelho?

Isso não é análise fundamentalista.

É o mercado de varejo apostando na expectativa de uma verticalização que ainda não gerou lucro.

Pode acontecer. Mas é especulação, não certeza.

Em 1997, Alan Greenspan falou de "exuberância irracional". Trinta anos depois, a pergunta é válida novamente.


A Pergunta Que Vale Sua Atenção Agora

Esta semana me confirmou uma tese que venho construindo há tempo:

O poder em IA não vai ficar com quem constrói o modelo maior.

Vai ficar com quem:

  1. Tem dados proprietários únicos para treinar modelos específicos na sua tarefa

  2. Implementa IA mais próxima do cliente, com menos latência e custo

  3. Não depende de um único gatekeeper corporativo para acessar inteligência computacional

A Anthropic desta semana mostrou que ser gatekeeper é o plano. A Harvey mostrou que você não precisa deles. O DiffusionGemma mostrou para onde o hardware está indo.

A pergunta que vale para o seu negócio não é qual modelo da Anthropic ou OpenAI devo usar.

É:

Que dados únicos minha empresa tem que, se usados para especializar um modelo em uma tarefa específica, criariam uma vantagem competitiva que nenhum concorrente consegue comprar com uma assinatura mensal?

Se você ainda não tem resposta clara para essa pergunta, essa é a conversa mais importante sobre IA que você pode ter nos próximos 90 dias.

Até a próxima edição.

Gabriel Zavelinski CEO, Comscience | Inteligência Competitiva com IA AI Weekly: toda semana, o que importa de verdade em IA estratégica

Curtiu esta edição? Compartilha com um executivo que ainda acha que "assinar o plano top" é estratégia de IA.

Vou ser direto com você.

Durante anos eu disse que o maior risco para executivos brasileiros era não adotar IA.

Eu estava certo sobre isso.

Mas eu subestimei um segundo risco, igualmente perigoso:

Adotar IA de players que vão te usar como moeda de troca quando for conveniente para eles.

Esta semana, isso ficou exposto de forma inequívoca.

Não por um vazamento. Não por uma especulação.

Por um anúncio oficial da Anthropic que causou a maior crise de reputação da empresa em dois anos.

Esta edição em 60 segundos:

  • A Anthropic silenciosamente degradava respostas do Claude sem te avisar. Recuou em 48h após pressão pública

  • SpaceX fez IPO a $2,1 trilhões: maior que JPMorgan e Meta combinados, com margem negativa em IA

  • Harvey atingiu performance do Claude Opus 4.6 com 24 horas de fine-tuning e 50x menos custo

  • DiffusionGemma processa 256 tokens por passo e muda o jogo do edge AI

  • A pergunta que redefine sua estratégia de IA para os próximos 24 meses


Segredo #1


A Ilusão da Parceria com Big Tech de IA

A crença que está colocando seu negócio em risco: "Essas empresas estão construindo IA para me ajudar."

Na última semana, a Anthropic lançou o Claude Fable 5 e o Claude Mythos 5, novos modelos para coding avançado, visão, pesquisa científica e tarefas de contexto longo.

Junto vieram novos "safeguards": proteções adicionais em biologia, química, cibersegurança e (detalhe relevante) distilação de modelos de linguagem.

A implementação? Silenciosa.

Quando os classificadores detectam que sua pergunta se encaixa nessas categorias, o sistema substitui o Fable 5 pelo Claude Opus 4.8 (um modelo inferior) sem te informar.

Você paga $10 por milhão de tokens de input pelo melhor modelo.

Recebe o segundo melhor.

Sem aviso.

A reação do mercado foi imediata e brutal. Em menos de 48 horas, a Anthropic recuou: prometeram informar explicitamente quando o downgrade acontecer.

Mas o problema real não é o downgrade em si.

O problema é a revelação da intenção.

Uma empresa que treinou seus modelos usando arquiteturas desenvolvidas pelo Google e dados gerados por você e por mim agora decide unilateralmente quem pode usar tecnologia de ponta para estudar biologia.

E faz isso sem te contar.

Aquela sensação que você talvez tenha tido, de que essas empresas tomam decisões paternalistas sobre o que você "pode" acessar, estava certa.

Não é paranoia.

É o modelo de negócio deles funcionando como planejado.

Let's Review:

  • Anthropic degradava respostas silenciosamente em categorias sensíveis sem informar usuários pagantes

  • A prática foi revertida em 48h após pressão pública, mas a intenção foi exposta

  • Modelos frontier não são parceiros neutros. São gatekeepers com agenda própria


Segredo #2


Você Não Precisa do Modelo Mais Caro Para Vencer

A crença que está te custando dinheiro: "Sem acesso aos modelos frontier mais poderosos, minha empresa fica para trás."

Enquanto a Anthropic se autossabotava, uma startup jurídica chamada Harvey fez algo silencioso e devastador para o modelo de negócios das Big Labs de IA.

Em parceria com a Trajectory Labs, a Harvey pegou o Nemotron 3 Ultra da NVIDIA, um modelo open source que marcava 0% na métrica interna de avaliação jurídica, e fez o seguinte:

24 horas de fine-tuning com dados proprietários.

Resultado: 5,8% de all-pass na mesma métrica.

Isso pode parecer pouco.

Mas esse número equivale à performance do Claude Opus 4.6, um dos melhores modelos frontier disponíveis hoje, custando $50 por milhão de tokens de output.

Com 50x redução de custo operacional.

O que é fine-tuning e por que muda tudo

Fine-tuning é o processo de pegar um modelo de linguagem já treinado e especializá-lo para uma tarefa específica usando dados próprios. É como contratar alguém com formação geral e depois treinar essa pessoa nas particularidades do seu negócio. Não pagar por um generalista premium que cobra 50x mais porque "sabe tudo".

Aqui está o insight que a Anthropic e a OpenAI preferem que você não descubra ainda:

Empresas não precisam de modelos generalistas que sejam bons em tudo. Precisam de modelos que sejam perfeitos em UMA coisa específica.

E quando você treina um modelo open source com dados únicos da sua empresa (suas conversas de vendas, seus contratos, seus processos operacionais), você cria uma vantagem competitiva que nenhuma assinatura de $200/mês por seat consegue replicar.

Porque esses dados não existem no mundo aberto.

A prova veio também da Ramp esta semana: o gasto com tokens de IA entre seus 70.000+ clientes cresceu 13x desde janeiro de 2025. Mas apenas 21% reportam resultados mensuráveis.

O problema não é o modelo.

É a falta de dados proprietários estruturados para direcionar esses modelos.

O ativo mais valioso em IA não é o acesso ao modelo mais poderoso. É o dado proprietário que só você tem.

Let's Review:

  • 24h de fine-tuning em modelo open source atingiu performance equivalente ao Claude Opus 4.6 com 50x menos custo

  • Empresas precisam de modelos excelentes em tarefas específicas. Não de generalistas caros

  • 79% das empresas que aumentam gasto com IA não conseguem medir resultado: o gargalo são os dados, não o modelo


Segredo #3


O Futuro da IA Não Vai Rodar na Nuvem

A crença que está ancorando sua estratégia no passado: "Minha dependência de APIs e cloud para IA é permanente e inevitável."

Esta semana, o Google lançou algo que passou praticamente despercebido nos grandes veículos:

O DiffusionGemma.

Uma variante do Gemma 4 que roda em hardware consumer e usa uma arquitetura completamente diferente dos LLMs que você conhece.

O que são modelos de difusão?

Modelos de linguagem tradicionais (GPT, Claude, Gemini standard) geram um token por vez. Um caractere por passo. É como escrever uma carta letra por letra.

Modelos de difusão partem de "ruído" e refinam iterativamente a resposta completa. Como Michelangelo descreveu a escultura: "A estátua já está dentro do bloco de mármore. Eu apenas removo o que é supérfluo."

A diferença técnica que muda tudo:

Enquanto um LLM autorregressivo precisa de 30 passos para gerar 30 tokens, o DiffusionGemma gera 256 tokens nesses mesmos 30 passos.

Mesma latência. 8,5x mais tokens.

E com um detalhe crucial: modelos de difusão resolvem o gargalo de memória que torna LLMs lentos em hardware local. O bottleneck de inference em edge não é capacidade de processamento. É largura de banda de memória. Difusão muda essa equação.

Por que isso importa para a sua empresa nos próximos 24 meses:

A maioria das tarefas que hoje custam tokens de API (triagem de emails, qualificação de leads, sumarização de documentos, resposta a perguntas frequentes) vai rodar localmente em 18 a 24 meses.

No celular do seu vendedor.

No tablet do seu técnico de campo.

No notebook do seu atendente de suporte.

Sem latência. Sem custo por token. Sem dependência de conexão com servidores americanos.

Quando isso acontecer, o modelo de assinatura mensal como conhecemos hoje não vai sobreviver.

Let's Review:

  • DiffusionGemma processa 256 tokens em 30 passos vs 30 tokens dos modelos autorregressivos na mesma latência

  • Modelos de difusão resolvem o gargalo de memória que torna LLMs lentos em dispositivos locais

  • Em 18-24 meses, tarefas cotidianas de IA vão rodar localmente, eliminando dependência de APIs caras


O Quadro da Semana: Números que Importam

Vamos conectar os pontos com os dados que definem este momento:

SpaceX IPO: 12 de junho de 2026

A SpaceX foi a IPO da semana. Abriu a $135/ação, com indicações de mercado em ~$171, chegando a uma capitalização de $2,1 trilhões, o mesmo valor de mercado da TSMC.

Para referência:

  • Vale 38x as receitas do Walmart

  • Vale 11x as receitas da Meta

  • Vale 10x as receitas do JP Morgan

  • Vale 7x as receitas da TSMC

Em dois contratos de IA, com a Anthropic (valor não divulgado) e o Google ($920 milhões por mês de outubro de 2026 a junho de 2029, incluindo acesso a 110.000 GPUs NVIDIA), a SpaceX garantiu ~$70 bilhões em receita comprometida para os próximos 3 anos.

Para contexto: o Starlink, que era o core da empresa até recentemente, tem ARR de $13,6 bilhões.

Em dois contratos de IA, a SpaceX já garantiu mais que o dobro do Starlink.

A tese funciona: SpaceX projeta chips, fabrica hardware, lança satélites com capacidade de compute, e fornece infraestrutura de IA como serviço.

Mas $2,1 trilhões com segmento de IA ainda no vermelho?

Isso não é análise fundamentalista.

É o mercado de varejo apostando na expectativa de uma verticalização que ainda não gerou lucro.

Pode acontecer. Mas é especulação, não certeza.

Em 1997, Alan Greenspan falou de "exuberância irracional". Trinta anos depois, a pergunta é válida novamente.


A Pergunta Que Vale Sua Atenção Agora

Esta semana me confirmou uma tese que venho construindo há tempo:

O poder em IA não vai ficar com quem constrói o modelo maior.

Vai ficar com quem:

  1. Tem dados proprietários únicos para treinar modelos específicos na sua tarefa

  2. Implementa IA mais próxima do cliente, com menos latência e custo

  3. Não depende de um único gatekeeper corporativo para acessar inteligência computacional

A Anthropic desta semana mostrou que ser gatekeeper é o plano. A Harvey mostrou que você não precisa deles. O DiffusionGemma mostrou para onde o hardware está indo.

A pergunta que vale para o seu negócio não é qual modelo da Anthropic ou OpenAI devo usar.

É:

Que dados únicos minha empresa tem que, se usados para especializar um modelo em uma tarefa específica, criariam uma vantagem competitiva que nenhum concorrente consegue comprar com uma assinatura mensal?

Se você ainda não tem resposta clara para essa pergunta, essa é a conversa mais importante sobre IA que você pode ter nos próximos 90 dias.

Até a próxima edição.

Gabriel Zavelinski CEO, Comscience | Inteligência Competitiva com IA AI Weekly: toda semana, o que importa de verdade em IA estratégica

Curtiu esta edição? Compartilha com um executivo que ainda acha que "assinar o plano top" é estratégia de IA.

Vou ser direto com você.

Durante anos eu disse que o maior risco para executivos brasileiros era não adotar IA.

Eu estava certo sobre isso.

Mas eu subestimei um segundo risco, igualmente perigoso:

Adotar IA de players que vão te usar como moeda de troca quando for conveniente para eles.

Esta semana, isso ficou exposto de forma inequívoca.

Não por um vazamento. Não por uma especulação.

Por um anúncio oficial da Anthropic que causou a maior crise de reputação da empresa em dois anos.

Esta edição em 60 segundos:

  • A Anthropic silenciosamente degradava respostas do Claude sem te avisar. Recuou em 48h após pressão pública

  • SpaceX fez IPO a $2,1 trilhões: maior que JPMorgan e Meta combinados, com margem negativa em IA

  • Harvey atingiu performance do Claude Opus 4.6 com 24 horas de fine-tuning e 50x menos custo

  • DiffusionGemma processa 256 tokens por passo e muda o jogo do edge AI

  • A pergunta que redefine sua estratégia de IA para os próximos 24 meses


Segredo #1


A Ilusão da Parceria com Big Tech de IA

A crença que está colocando seu negócio em risco: "Essas empresas estão construindo IA para me ajudar."

Na última semana, a Anthropic lançou o Claude Fable 5 e o Claude Mythos 5, novos modelos para coding avançado, visão, pesquisa científica e tarefas de contexto longo.

Junto vieram novos "safeguards": proteções adicionais em biologia, química, cibersegurança e (detalhe relevante) distilação de modelos de linguagem.

A implementação? Silenciosa.

Quando os classificadores detectam que sua pergunta se encaixa nessas categorias, o sistema substitui o Fable 5 pelo Claude Opus 4.8 (um modelo inferior) sem te informar.

Você paga $10 por milhão de tokens de input pelo melhor modelo.

Recebe o segundo melhor.

Sem aviso.

A reação do mercado foi imediata e brutal. Em menos de 48 horas, a Anthropic recuou: prometeram informar explicitamente quando o downgrade acontecer.

Mas o problema real não é o downgrade em si.

O problema é a revelação da intenção.

Uma empresa que treinou seus modelos usando arquiteturas desenvolvidas pelo Google e dados gerados por você e por mim agora decide unilateralmente quem pode usar tecnologia de ponta para estudar biologia.

E faz isso sem te contar.

Aquela sensação que você talvez tenha tido, de que essas empresas tomam decisões paternalistas sobre o que você "pode" acessar, estava certa.

Não é paranoia.

É o modelo de negócio deles funcionando como planejado.

Let's Review:

  • Anthropic degradava respostas silenciosamente em categorias sensíveis sem informar usuários pagantes

  • A prática foi revertida em 48h após pressão pública, mas a intenção foi exposta

  • Modelos frontier não são parceiros neutros. São gatekeepers com agenda própria


Segredo #2


Você Não Precisa do Modelo Mais Caro Para Vencer

A crença que está te custando dinheiro: "Sem acesso aos modelos frontier mais poderosos, minha empresa fica para trás."

Enquanto a Anthropic se autossabotava, uma startup jurídica chamada Harvey fez algo silencioso e devastador para o modelo de negócios das Big Labs de IA.

Em parceria com a Trajectory Labs, a Harvey pegou o Nemotron 3 Ultra da NVIDIA, um modelo open source que marcava 0% na métrica interna de avaliação jurídica, e fez o seguinte:

24 horas de fine-tuning com dados proprietários.

Resultado: 5,8% de all-pass na mesma métrica.

Isso pode parecer pouco.

Mas esse número equivale à performance do Claude Opus 4.6, um dos melhores modelos frontier disponíveis hoje, custando $50 por milhão de tokens de output.

Com 50x redução de custo operacional.

O que é fine-tuning e por que muda tudo

Fine-tuning é o processo de pegar um modelo de linguagem já treinado e especializá-lo para uma tarefa específica usando dados próprios. É como contratar alguém com formação geral e depois treinar essa pessoa nas particularidades do seu negócio. Não pagar por um generalista premium que cobra 50x mais porque "sabe tudo".

Aqui está o insight que a Anthropic e a OpenAI preferem que você não descubra ainda:

Empresas não precisam de modelos generalistas que sejam bons em tudo. Precisam de modelos que sejam perfeitos em UMA coisa específica.

E quando você treina um modelo open source com dados únicos da sua empresa (suas conversas de vendas, seus contratos, seus processos operacionais), você cria uma vantagem competitiva que nenhuma assinatura de $200/mês por seat consegue replicar.

Porque esses dados não existem no mundo aberto.

A prova veio também da Ramp esta semana: o gasto com tokens de IA entre seus 70.000+ clientes cresceu 13x desde janeiro de 2025. Mas apenas 21% reportam resultados mensuráveis.

O problema não é o modelo.

É a falta de dados proprietários estruturados para direcionar esses modelos.

O ativo mais valioso em IA não é o acesso ao modelo mais poderoso. É o dado proprietário que só você tem.

Let's Review:

  • 24h de fine-tuning em modelo open source atingiu performance equivalente ao Claude Opus 4.6 com 50x menos custo

  • Empresas precisam de modelos excelentes em tarefas específicas. Não de generalistas caros

  • 79% das empresas que aumentam gasto com IA não conseguem medir resultado: o gargalo são os dados, não o modelo


Segredo #3


O Futuro da IA Não Vai Rodar na Nuvem

A crença que está ancorando sua estratégia no passado: "Minha dependência de APIs e cloud para IA é permanente e inevitável."

Esta semana, o Google lançou algo que passou praticamente despercebido nos grandes veículos:

O DiffusionGemma.

Uma variante do Gemma 4 que roda em hardware consumer e usa uma arquitetura completamente diferente dos LLMs que você conhece.

O que são modelos de difusão?

Modelos de linguagem tradicionais (GPT, Claude, Gemini standard) geram um token por vez. Um caractere por passo. É como escrever uma carta letra por letra.

Modelos de difusão partem de "ruído" e refinam iterativamente a resposta completa. Como Michelangelo descreveu a escultura: "A estátua já está dentro do bloco de mármore. Eu apenas removo o que é supérfluo."

A diferença técnica que muda tudo:

Enquanto um LLM autorregressivo precisa de 30 passos para gerar 30 tokens, o DiffusionGemma gera 256 tokens nesses mesmos 30 passos.

Mesma latência. 8,5x mais tokens.

E com um detalhe crucial: modelos de difusão resolvem o gargalo de memória que torna LLMs lentos em hardware local. O bottleneck de inference em edge não é capacidade de processamento. É largura de banda de memória. Difusão muda essa equação.

Por que isso importa para a sua empresa nos próximos 24 meses:

A maioria das tarefas que hoje custam tokens de API (triagem de emails, qualificação de leads, sumarização de documentos, resposta a perguntas frequentes) vai rodar localmente em 18 a 24 meses.

No celular do seu vendedor.

No tablet do seu técnico de campo.

No notebook do seu atendente de suporte.

Sem latência. Sem custo por token. Sem dependência de conexão com servidores americanos.

Quando isso acontecer, o modelo de assinatura mensal como conhecemos hoje não vai sobreviver.

Let's Review:

  • DiffusionGemma processa 256 tokens em 30 passos vs 30 tokens dos modelos autorregressivos na mesma latência

  • Modelos de difusão resolvem o gargalo de memória que torna LLMs lentos em dispositivos locais

  • Em 18-24 meses, tarefas cotidianas de IA vão rodar localmente, eliminando dependência de APIs caras


O Quadro da Semana: Números que Importam

Vamos conectar os pontos com os dados que definem este momento:

SpaceX IPO: 12 de junho de 2026

A SpaceX foi a IPO da semana. Abriu a $135/ação, com indicações de mercado em ~$171, chegando a uma capitalização de $2,1 trilhões, o mesmo valor de mercado da TSMC.

Para referência:

  • Vale 38x as receitas do Walmart

  • Vale 11x as receitas da Meta

  • Vale 10x as receitas do JP Morgan

  • Vale 7x as receitas da TSMC

Em dois contratos de IA, com a Anthropic (valor não divulgado) e o Google ($920 milhões por mês de outubro de 2026 a junho de 2029, incluindo acesso a 110.000 GPUs NVIDIA), a SpaceX garantiu ~$70 bilhões em receita comprometida para os próximos 3 anos.

Para contexto: o Starlink, que era o core da empresa até recentemente, tem ARR de $13,6 bilhões.

Em dois contratos de IA, a SpaceX já garantiu mais que o dobro do Starlink.

A tese funciona: SpaceX projeta chips, fabrica hardware, lança satélites com capacidade de compute, e fornece infraestrutura de IA como serviço.

Mas $2,1 trilhões com segmento de IA ainda no vermelho?

Isso não é análise fundamentalista.

É o mercado de varejo apostando na expectativa de uma verticalização que ainda não gerou lucro.

Pode acontecer. Mas é especulação, não certeza.

Em 1997, Alan Greenspan falou de "exuberância irracional". Trinta anos depois, a pergunta é válida novamente.


A Pergunta Que Vale Sua Atenção Agora

Esta semana me confirmou uma tese que venho construindo há tempo:

O poder em IA não vai ficar com quem constrói o modelo maior.

Vai ficar com quem:

  1. Tem dados proprietários únicos para treinar modelos específicos na sua tarefa

  2. Implementa IA mais próxima do cliente, com menos latência e custo

  3. Não depende de um único gatekeeper corporativo para acessar inteligência computacional

A Anthropic desta semana mostrou que ser gatekeeper é o plano. A Harvey mostrou que você não precisa deles. O DiffusionGemma mostrou para onde o hardware está indo.

A pergunta que vale para o seu negócio não é qual modelo da Anthropic ou OpenAI devo usar.

É:

Que dados únicos minha empresa tem que, se usados para especializar um modelo em uma tarefa específica, criariam uma vantagem competitiva que nenhum concorrente consegue comprar com uma assinatura mensal?

Se você ainda não tem resposta clara para essa pergunta, essa é a conversa mais importante sobre IA que você pode ter nos próximos 90 dias.

Até a próxima edição.

Gabriel Zavelinski CEO, Comscience | Inteligência Competitiva com IA AI Weekly: toda semana, o que importa de verdade em IA estratégica

Curtiu esta edição? Compartilha com um executivo que ainda acha que "assinar o plano top" é estratégia de IA.

Vou ser direto com você.

Durante anos eu disse que o maior risco para executivos brasileiros era não adotar IA.

Eu estava certo sobre isso.

Mas eu subestimei um segundo risco, igualmente perigoso:

Adotar IA de players que vão te usar como moeda de troca quando for conveniente para eles.

Esta semana, isso ficou exposto de forma inequívoca.

Não por um vazamento. Não por uma especulação.

Por um anúncio oficial da Anthropic que causou a maior crise de reputação da empresa em dois anos.

Esta edição em 60 segundos:

  • A Anthropic silenciosamente degradava respostas do Claude sem te avisar. Recuou em 48h após pressão pública

  • SpaceX fez IPO a $2,1 trilhões: maior que JPMorgan e Meta combinados, com margem negativa em IA

  • Harvey atingiu performance do Claude Opus 4.6 com 24 horas de fine-tuning e 50x menos custo

  • DiffusionGemma processa 256 tokens por passo e muda o jogo do edge AI

  • A pergunta que redefine sua estratégia de IA para os próximos 24 meses


Segredo #1


A Ilusão da Parceria com Big Tech de IA

A crença que está colocando seu negócio em risco: "Essas empresas estão construindo IA para me ajudar."

Na última semana, a Anthropic lançou o Claude Fable 5 e o Claude Mythos 5, novos modelos para coding avançado, visão, pesquisa científica e tarefas de contexto longo.

Junto vieram novos "safeguards": proteções adicionais em biologia, química, cibersegurança e (detalhe relevante) distilação de modelos de linguagem.

A implementação? Silenciosa.

Quando os classificadores detectam que sua pergunta se encaixa nessas categorias, o sistema substitui o Fable 5 pelo Claude Opus 4.8 (um modelo inferior) sem te informar.

Você paga $10 por milhão de tokens de input pelo melhor modelo.

Recebe o segundo melhor.

Sem aviso.

A reação do mercado foi imediata e brutal. Em menos de 48 horas, a Anthropic recuou: prometeram informar explicitamente quando o downgrade acontecer.

Mas o problema real não é o downgrade em si.

O problema é a revelação da intenção.

Uma empresa que treinou seus modelos usando arquiteturas desenvolvidas pelo Google e dados gerados por você e por mim agora decide unilateralmente quem pode usar tecnologia de ponta para estudar biologia.

E faz isso sem te contar.

Aquela sensação que você talvez tenha tido, de que essas empresas tomam decisões paternalistas sobre o que você "pode" acessar, estava certa.

Não é paranoia.

É o modelo de negócio deles funcionando como planejado.

Let's Review:

  • Anthropic degradava respostas silenciosamente em categorias sensíveis sem informar usuários pagantes

  • A prática foi revertida em 48h após pressão pública, mas a intenção foi exposta

  • Modelos frontier não são parceiros neutros. São gatekeepers com agenda própria


Segredo #2


Você Não Precisa do Modelo Mais Caro Para Vencer

A crença que está te custando dinheiro: "Sem acesso aos modelos frontier mais poderosos, minha empresa fica para trás."

Enquanto a Anthropic se autossabotava, uma startup jurídica chamada Harvey fez algo silencioso e devastador para o modelo de negócios das Big Labs de IA.

Em parceria com a Trajectory Labs, a Harvey pegou o Nemotron 3 Ultra da NVIDIA, um modelo open source que marcava 0% na métrica interna de avaliação jurídica, e fez o seguinte:

24 horas de fine-tuning com dados proprietários.

Resultado: 5,8% de all-pass na mesma métrica.

Isso pode parecer pouco.

Mas esse número equivale à performance do Claude Opus 4.6, um dos melhores modelos frontier disponíveis hoje, custando $50 por milhão de tokens de output.

Com 50x redução de custo operacional.

O que é fine-tuning e por que muda tudo

Fine-tuning é o processo de pegar um modelo de linguagem já treinado e especializá-lo para uma tarefa específica usando dados próprios. É como contratar alguém com formação geral e depois treinar essa pessoa nas particularidades do seu negócio. Não pagar por um generalista premium que cobra 50x mais porque "sabe tudo".

Aqui está o insight que a Anthropic e a OpenAI preferem que você não descubra ainda:

Empresas não precisam de modelos generalistas que sejam bons em tudo. Precisam de modelos que sejam perfeitos em UMA coisa específica.

E quando você treina um modelo open source com dados únicos da sua empresa (suas conversas de vendas, seus contratos, seus processos operacionais), você cria uma vantagem competitiva que nenhuma assinatura de $200/mês por seat consegue replicar.

Porque esses dados não existem no mundo aberto.

A prova veio também da Ramp esta semana: o gasto com tokens de IA entre seus 70.000+ clientes cresceu 13x desde janeiro de 2025. Mas apenas 21% reportam resultados mensuráveis.

O problema não é o modelo.

É a falta de dados proprietários estruturados para direcionar esses modelos.

O ativo mais valioso em IA não é o acesso ao modelo mais poderoso. É o dado proprietário que só você tem.

Let's Review:

  • 24h de fine-tuning em modelo open source atingiu performance equivalente ao Claude Opus 4.6 com 50x menos custo

  • Empresas precisam de modelos excelentes em tarefas específicas. Não de generalistas caros

  • 79% das empresas que aumentam gasto com IA não conseguem medir resultado: o gargalo são os dados, não o modelo


Segredo #3


O Futuro da IA Não Vai Rodar na Nuvem

A crença que está ancorando sua estratégia no passado: "Minha dependência de APIs e cloud para IA é permanente e inevitável."

Esta semana, o Google lançou algo que passou praticamente despercebido nos grandes veículos:

O DiffusionGemma.

Uma variante do Gemma 4 que roda em hardware consumer e usa uma arquitetura completamente diferente dos LLMs que você conhece.

O que são modelos de difusão?

Modelos de linguagem tradicionais (GPT, Claude, Gemini standard) geram um token por vez. Um caractere por passo. É como escrever uma carta letra por letra.

Modelos de difusão partem de "ruído" e refinam iterativamente a resposta completa. Como Michelangelo descreveu a escultura: "A estátua já está dentro do bloco de mármore. Eu apenas removo o que é supérfluo."

A diferença técnica que muda tudo:

Enquanto um LLM autorregressivo precisa de 30 passos para gerar 30 tokens, o DiffusionGemma gera 256 tokens nesses mesmos 30 passos.

Mesma latência. 8,5x mais tokens.

E com um detalhe crucial: modelos de difusão resolvem o gargalo de memória que torna LLMs lentos em hardware local. O bottleneck de inference em edge não é capacidade de processamento. É largura de banda de memória. Difusão muda essa equação.

Por que isso importa para a sua empresa nos próximos 24 meses:

A maioria das tarefas que hoje custam tokens de API (triagem de emails, qualificação de leads, sumarização de documentos, resposta a perguntas frequentes) vai rodar localmente em 18 a 24 meses.

No celular do seu vendedor.

No tablet do seu técnico de campo.

No notebook do seu atendente de suporte.

Sem latência. Sem custo por token. Sem dependência de conexão com servidores americanos.

Quando isso acontecer, o modelo de assinatura mensal como conhecemos hoje não vai sobreviver.

Let's Review:

  • DiffusionGemma processa 256 tokens em 30 passos vs 30 tokens dos modelos autorregressivos na mesma latência

  • Modelos de difusão resolvem o gargalo de memória que torna LLMs lentos em dispositivos locais

  • Em 18-24 meses, tarefas cotidianas de IA vão rodar localmente, eliminando dependência de APIs caras


O Quadro da Semana: Números que Importam

Vamos conectar os pontos com os dados que definem este momento:

SpaceX IPO: 12 de junho de 2026

A SpaceX foi a IPO da semana. Abriu a $135/ação, com indicações de mercado em ~$171, chegando a uma capitalização de $2,1 trilhões, o mesmo valor de mercado da TSMC.

Para referência:

  • Vale 38x as receitas do Walmart

  • Vale 11x as receitas da Meta

  • Vale 10x as receitas do JP Morgan

  • Vale 7x as receitas da TSMC

Em dois contratos de IA, com a Anthropic (valor não divulgado) e o Google ($920 milhões por mês de outubro de 2026 a junho de 2029, incluindo acesso a 110.000 GPUs NVIDIA), a SpaceX garantiu ~$70 bilhões em receita comprometida para os próximos 3 anos.

Para contexto: o Starlink, que era o core da empresa até recentemente, tem ARR de $13,6 bilhões.

Em dois contratos de IA, a SpaceX já garantiu mais que o dobro do Starlink.

A tese funciona: SpaceX projeta chips, fabrica hardware, lança satélites com capacidade de compute, e fornece infraestrutura de IA como serviço.

Mas $2,1 trilhões com segmento de IA ainda no vermelho?

Isso não é análise fundamentalista.

É o mercado de varejo apostando na expectativa de uma verticalização que ainda não gerou lucro.

Pode acontecer. Mas é especulação, não certeza.

Em 1997, Alan Greenspan falou de "exuberância irracional". Trinta anos depois, a pergunta é válida novamente.


A Pergunta Que Vale Sua Atenção Agora

Esta semana me confirmou uma tese que venho construindo há tempo:

O poder em IA não vai ficar com quem constrói o modelo maior.

Vai ficar com quem:

  1. Tem dados proprietários únicos para treinar modelos específicos na sua tarefa

  2. Implementa IA mais próxima do cliente, com menos latência e custo

  3. Não depende de um único gatekeeper corporativo para acessar inteligência computacional

A Anthropic desta semana mostrou que ser gatekeeper é o plano. A Harvey mostrou que você não precisa deles. O DiffusionGemma mostrou para onde o hardware está indo.

A pergunta que vale para o seu negócio não é qual modelo da Anthropic ou OpenAI devo usar.

É:

Que dados únicos minha empresa tem que, se usados para especializar um modelo em uma tarefa específica, criariam uma vantagem competitiva que nenhum concorrente consegue comprar com uma assinatura mensal?

Se você ainda não tem resposta clara para essa pergunta, essa é a conversa mais importante sobre IA que você pode ter nos próximos 90 dias.

Até a próxima edição.

Gabriel Zavelinski CEO, Comscience | Inteligência Competitiva com IA AI Weekly: toda semana, o que importa de verdade em IA estratégica

Curtiu esta edição? Compartilha com um executivo que ainda acha que "assinar o plano top" é estratégia de IA.

Você sabe que precisa usar IA, mas não sabe por onde começar

Comscience

2025 © All right reserved

Comscience

2025 © All right reserved

Usamos cookies para melhorar sua experiência. Ao continuar, você concorda com nossa Política de Privacidade (LGPD).