Quando a gente está usando, por exemplo, APIs e serviços comerciais, a gente paga por token. Você pode fazer a mesma frase em português e em inglês e, geralmente, em português, pela natureza da língua e pela representação nesses dicionários, tende a consumir entre 15% a 20% mais de token. Ou seja, a gente gasta mais na inteligência artificial só pelo fato de falar português.
Diogo Cortiz
Cada IA tem uma espécie de dicionário interno. A partir do que está registrado nele, uma palavra pode virar um token ou vários. Se o modelo não tem uma forma comum registrada, ele combina pedaços. E isso aumenta o consumo de tokens quando são vocábulos de idiomas menos representados nesses documentos, caso do português.
A discussão sobre idioma, no entanto, não passa apenas pelo custo. Um estudo apresentado em Deu Tilt mostra que a IA é capaz de mudar como as pessoas se comunicam e até influenciar posições sobre temas sensíveis, como pena de morte e aborto. Mas essa transformação foi observada apenas em inglês.
Os próprios criadores do estudo atinam para o fato de que esse efeito que eles constataram tem que ser vislumbrado e visto em outras línguas. A gente já viu outros estudos que mostram que a inteligência artificial lida bem melhor respondendo em inglês do que em outros idiomas.
Helton Simões Gomes
Na conversa, Cortiz usa uma metáfora para descrever a sensação de fluência de IA: pode até parecer que o chatbot “fala português”, mas ele pensa em inglês e só depois traduzir para o nosso idioma. Isso fica mais evidente para modelos que explicitam as etapas de raciocínio antes de responder.








