Quarta-feira, 20/05/26

Token Maxxing vira febre no Vale do Silício e inflaciona conta de IA

Token Maxxing vira febre no Vale do Silício e inflaciona conta de IA
Token Maxxing vira febre no Vale do Silício e inflaciona – Reprodução

‘Token Maxxing’ é essa febre do Vale do Silício de produzir muita coisa com inteligência artificial, mas produzir de maneira insana mesmo. A palavra ‘token’ vem de como a inteligência artificial processa e como ela te cobra: por meio de tokens, que é uma palavra ou pedacinhos de palavra. Surgiu essa febre de eu colocar inteligência artificial para produzir, e eu vou contabilizando quanto de token eu processei. Isso está virando um sinônimo de produtividade: as pessoas começam a competir para ver quem produziu mais por meio da quantidade de tokens que ela processou.
Diogo Cortiz

Um painel interativo com o consumo de tokens de funcionários da Meta expôs o tamanho do apetite por IA. O ranking, revelado pelo The Information, listava os 250 maiores consumidores entre os mais de 85 mil funcionários da empresa.

Em 30 dias foram consumidos 60 trilhões de tokens. O cara que ficou no topo da lista gastou 281 bilhões de tokens. Se a gente considerar um custo de mais ou menos 5 dólares por cada milhão de token, esse cara custou para a Meta US$ 1,4 milhão. E toda essa quantidade de tokens em 30 dias, se a gente considerar esse custo, custou para a Meta US$ 300 milhões.
Helton Simões Gomes

Parte do consumo vem do jeito como o modo de raciocínio das IAs operam, gerando tokens intermediários além daqueles usados na entrada e na saída. Isso empurra o gasto para cima quando empresas colocam agentes para executar tarefas.

O ‘Token Maxxing’ tem claros vencedores: quem oferece acesso a serviços de IA. Como a cobrança é por token, essas empresas têm incentivo direto para fomentar a corrida.

As que vendem os serviços –Anthropic, Google, OpenAI– porque as outras empresas pagam por token. Ou seja, quanto mais consumir token, mais elas vão lucrar com isso. Para o usuário final, os limites estão ficando menores, porque eles têm uma quantidade limitada, finita, de poder de processamento. ‘Eu vou dar isso para as empresas que estão pagando pela API, que é um custo mais alto, e aí eu vou limitando para quem paga assinatura’.
Diogo Cortiz


T LB

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *