A IA Gera, a Régua Julga: Quando Confiar num Modelo e Quando Confiar numa Regra

O elogio que me fez repensar tudo

Por muito tempo, eu respondia à pergunta "como você garante qualidade?" do jeito que quase todo mundo responde hoje: "uso uma IA melhor". Quanto mais potente o modelo, melhor o resultado — era o que eu acreditava. Estava errado, e percebi isso olhando justamente para a parte do meu produto em que mais confio.

Essa parte não usa IA nenhuma. É uma régua — um conjunto de regras objetivas que dá sempre a mesma resposta para a mesma entrada. Ela não tem opinião, não muda de humor entre uma execução e outra, e não precisa ser convencida. E é exatamente por isso que confio nela mais do que em qualquer modelo.

Cheguei a um princípio que hoje guia como eu construo: a IA gera; a régua julga. Este artigo é sobre essa divisão de trabalho — onde um modelo de IA é insubstituível, onde uma regra simples é melhor, e por que confundir os dois é um erro caro.

O problema de pedir para IA julgar o próprio trabalho

Existe uma armadilha sutil em usar IA para tudo: quando o mesmo modelo gera um texto e depois é perguntado "isso está bom?", ele tende a concordar consigo mesmo. Não por má-fé — é da natureza dele. Um gerador apaixonado pela própria resposta não é um bom juiz dela.

No mundo dos times humanos, a gente resolve isso há décadas: quem escreve o código não é quem aprova; quem produz a peça não é quem faz o controle de qualidade. Chama-se separação de papéis, e existe porque um olhar independente pega o que o autor não vê. Com IA, o princípio é o mesmo — e a forma mais barata e confiável de ter esse olhar independente, quando a pergunta é objetiva, muitas vezes não é outro modelo. É uma régua.

O que é julgar com régua em vez de modelo

Régua, aqui, é qualquer julgamento que pode ser escrito como uma regra: um limite, uma checagem, uma conta. "O texto tem pelo menos uma fonte?" "O preço que aparece na página de vendas é o mesmo que o sistema cobra?" "Esse artigo repete um trecho que eu já publiquei?" São perguntas com resposta objetiva — sim ou não, dentro ou fora do limite. Não precisam de um modelo de bilhões de parâmetros para responder; precisam de uma regra bem escrita.

A palavra técnica para isso é determinístico — que dá sempre a mesma resposta para a mesma entrada. Rode mil vezes, o resultado é idêntico. Parece pouco, mas é uma propriedade poderosa, e é justamente o que um modelo de IA, por design, não oferece: dois pedidos iguais a uma IA podem voltar diferentes, e isso é uma feature dela, não um defeito. Ótimo para criar; ruim para julgar.

Por que a régua ganha em três pontos

Quando a decisão é objetiva, a régua vence o modelo em três frentes concretas.

É reproduzível. A mesma entrada gera sempre a mesma resposta, então dá para confiar e para auditar. Você consegue escrever um teste automático — uma verificação que roda sozinha antes de algo ir para o ar — que trava o sistema se a regra for violada, e dormir tranquilo sabendo que ele vai pegar o erro antes de chegar no cliente.

É barata e rápida. Chamar um modelo de IA custa dinheiro e tempo a cada execução. Uma regra roda em milissegundos, de graça, quantas vezes for preciso. Para checagens que acontecem o tempo todo, isso é a diferença entre uma operação saudável e uma conta que cresce sem controle conforme você ganha usuários.

Não concorda consigo mesma. A régua não tem ego nem cansaço, e não foi ela quem gerou o conteúdo — então não tem nenhum incentivo a aprovar. É o juiz independente que todo gerador precisa, e que o próprio gerador nunca consegue ser.

Onde a régua cabe — e onde ela não cabe

A parte difícil, e a mais importante, é saber onde traçar a linha. A régua cabe no que é objetivo. Ela não cabe no que é subjetivo — e tentar forçá-la ali quebra tudo.

Objetivo é o que tem resposta verificável: tamanho, presença de fonte, consistência entre telas, formato, repetição. Para isso, regra. Subjetivo é o que depende de julgamento: "essa ideia é boa?", "esse texto convence?", "essa estratégia faz sentido para esse mercado?". Para isso, um modelo de IA — ou, melhor ainda, um humano — porque não existe régua que capture nuance.

O erro dos dois lados é igualmente caro. Quem joga tudo na IA paga caro para ela responder mal perguntas que uma regra responderia de graça e melhor. Quem tenta reduzir tudo a regra acaba com um produto rígido, incapaz de lidar com o que não cabe numa fórmula. A maestria está em separar com honestidade: isto é objetivo, vai de régua; aquilo é subjetivo, vai de modelo ou de gente.

A IA não fica menor — ela fica no lugar certo

Nada disso diminui a IA. Pelo contrário: colocar a régua no julgamento objetivo libera o modelo para fazer o que só ele faz bem — gerar, explorar, escrever, propor, lidar com ambiguidade e linguagem. A IA é o motor criativo; a régua é o piso de qualidade que impede o criativo de virar bagunça.

Na prática, os dois trabalham juntos: a IA produz volume e variedade numa velocidade que nenhum humano alcança; a régua garante que o que sai tenha um padrão mínimo inegociável, sem depender de alguém revisar tudo na mão. É essa combinação — geração farta e julgamento confiável — que torna possível escalar qualidade, e não apenas quantidade.

Exemplo: duas perguntas, dois caminhos

Um exemplo concreto deixa a fronteira nítida. Pegue duas perguntas que um produto de conteúdo faz o tempo todo. A primeira: "o preço que aparece na página de vendas é o mesmo que o sistema cobra?". Tem resposta verificável, sim ou não — é régua: uma checagem automática compara os dois valores e trava se divergirem, sempre igual, de graça. A segunda: "esse texto convence o leitor a confiar na marca?". Não tem resposta única; duas pessoas competentes podem discordar com bons argumentos — é julgamento, de um modelo ou de uma pessoa.

A tentação é tratar as duas do mesmo jeito. Quem joga a primeira pergunta numa IA paga caro para receber "acho que sim", com variação a cada execução, quando uma regra responderia na hora e sempre igual. Quem tenta reduzir a segunda a uma fórmula acaba com um texto tecnicamente correto e morto. A maestria é separar: a primeira é régua; a segunda é modelo ou gente.

Como eu decido, na prática

Quando vou construir qualquer coisa, faço uma pergunta antes de tudo: essa decisão é objetiva ou subjetiva? Se for objetiva, ela vira regra — e, sempre que possível, uma verificação automática que roda antes de qualquer coisa ir para o ar. Se for subjetiva, aí sim entra um modelo, ou eu mesmo.

O critério que uso para saber em qual lado estou é simples: se duas pessoas competentes olhando a mesma coisa sempre chegariam à mesma resposta, é objetivo — vai de régua. Se pessoas competentes podem discordar com bons argumentos, é subjetivo — vai de julgamento. A maior parte das checagens de qualidade de um produto, quando você olha de perto, é objetiva. E quase ninguém as trata assim.

O ganho mais valioso disso aparece de madrugada. A régua é a parte do produto em que confio sem precisar reler. Ela roda sozinha, pega o que precisa pegar, e me deixa gastar a atenção onde ela realmente importa: no julgamento que nenhuma regra substitui.

O custo escondido de terceirizar todo julgamento para IA

Vale dizer o que acontece quando você ignora isso e deixa a IA julgar tudo. Três custos aparecem, e nenhum é óbvio no começo.

O custo financeiro escala com o uso: cada checagem vira uma chamada paga, e o que era barato com dez usuários fica pesado com dez mil. O custo de confiabilidade aparece quando o mesmo conteúdo recebe avaliações diferentes em execuções diferentes — porque o modelo varia — e você não consegue mais prometer um padrão. E o custo mais silencioso é o de previsibilidade: não dá para fixar o comportamento de algo que muda a cada rodada, então você perde o chão para testar e para garantir.

A régua resolve os três de uma vez: custo perto de zero, resposta idêntica sempre, e comportamento que cabe num teste. Não porque seja sofisticada — porque é objetiva.

Conclusão: a régua é o que torna a IA confiável

A mudança de mentalidade que eu queria ter feito antes é esta: a pergunta certa não é "como uso mais IA?", e sim "o que aqui é objetivo o suficiente para virar regra, e o que é subjetivo o suficiente para precisar de um modelo?". Quem responde bem a essa pergunta constrói produtos que escalam qualidade; quem não responde constrói produtos impressionantes que ninguém consegue garantir.

A IA todo mundo vai ter — os mesmos modelos, ao alcance de um clique. O que diferencia não é o modelo. É onde você decide que a IA gera e onde a régua julga. Essa fronteira, bem traçada, é o que faz um produto ser confiável em vez de só parecer inteligente.

Frequently asked questions

O que significa "a IA gera, a régua julga"?

É uma divisão de trabalho: usar a IA para gerar (escrever, propor, explorar) e usar regras objetivas — determinísticas — para julgar o que pode ser verificado (tamanho, fonte, consistência, formato, repetição). Reserva-se o modelo para o que é subjetivo e a régua para o que é objetivo.

Por que não usar uma IA para avaliar a qualidade também?

Porque quando o mesmo tipo de modelo gera e julga, ele tende a concordar consigo mesmo; além disso, custa a cada execução e varia de uma rodada para outra. Para o que é objetivo, uma regra é mais barata, dá sempre a mesma resposta e funciona como juiz independente de quem gerou.

O que é uma checagem determinística?

É uma regra que dá sempre a mesma resposta para a mesma entrada. Rode mil vezes e o resultado é idêntico — o que a torna confiável, auditável e fácil de testar. É o oposto de um modelo de IA, que pode responder diferente para o mesmo pedido.

A IA deixa de ser importante nesse modelo?

Não. Ela continua sendo o motor de geração — escreve, explora e lida com linguagem e ambiguidade como nada mais faz. A régua só assume o julgamento objetivo, liberando o modelo para o que ele faz de melhor: criar.

Que tipo de decisão dá para automatizar com regra em vez de IA?

Tudo que tem resposta verificável: o conteúdo tem fonte? o tamanho está dentro do limite? o preço bate entre as telas? há repetição de algo já publicado? São perguntas objetivas, com resposta sim ou não, que uma regra responde de graça e sempre igual.

Isso vale só para quem tem time técnico?

O princípio vale para qualquer um que constrói produto: saber separar o que é objetivo do que é subjetivo. A implementação é técnica, mas a decisão — "isto é régua, aquilo é modelo" — é de produto, e qualquer fundador pode e deveria tomá-la.

Como sei se uma decisão é objetiva (régua) ou subjetiva (modelo)?

Um teste simples: se duas pessoas competentes olhando a mesma coisa sempre chegariam à mesma resposta, é objetivo — vai de régua. Se podem discordar com bons argumentos, é subjetivo — vai de modelo ou de gente.

Sources & References

1Anthropic, "Building Effective Agents", Anthropic Engineering, anthropic.com, 2024
2Martin Fowler, "Continuous Integration", martinfowler.com, 2024
3Kent Beck, "Test-Driven Development: By Example", Addison-Wesley, 2002
4Andrew Ng, "Agentic Workflows", The Batch — DeepLearning.AI, 2024
5Eric Ries, "The Lean Startup: How Today's Entrepreneurs Use Continuous Innovation to Create Radically Successful Businesses", Crown Business, 2011

About the Author

Eduardo Henrique Ananias é Co-founder & CEO da WM3 Digital e Founder da e-merge.ia. Constrói produtos digitais combinando IA para gerar e regras determinísticas para julgar — reservando o modelo para o subjetivo e a régua para o objetivo. Sua abordagem une engenharia de produto, disciplina de processo e uso prático de IA para transformar ideias em ativos digitais confiáveis, não apenas impressionantes.

Eduardo Henrique Ananias — Co-founder & CEO — WM3 Digital | Founder — E-merge.ia

Ready to turn your idea into a blueprint?

Describe your project and receive a blueprint preview in ~30 seconds. No login, no credit card.

Generate free preview

All articles