Tem erro que passa porque a query roda. Tem erro que passa porque o dashboard abre. E tem erro que passa porque a reunião já estava atrasada e ninguém quis parar para discutir a conta.
A média da média entra muito nessa terceira categoria.
Ela aparece quando alguém pega taxas já prontas por campanha, por loja, por canal, por vendedor ou por semana e tira uma média simples entre elas. No papel, parece razoável. Na prática, muitas vezes isso distorce a leitura porque cada uma dessas taxas nasceu sobre um volume diferente.
Já vi isso em taxa de conversão, ticket médio, retenção, open rate, CTR e até em métricas internas de operação. O padrão é sempre parecido: o número final parece elegante, mas conta a história errada.
O problema não está na conta da média. Está no peso escondido
Imagine duas campanhas:
- Campanha A: 10 conversões em 1.000 sessões = 1% de conversão.
- Campanha B: 8 conversões em 20 sessões = 40% de conversão.
Se você fizer a média simples das duas taxas, chega a 20,5%.
Mas essa não é a conversão real do conjunto. Somando tudo, você teve 18 conversões em 1.020 sessões. A taxa consolidada é 1,76%.
Percebe o tamanho do desvio? A campanha menor, que quase não teve volume, ganhou o mesmo peso analítico da campanha que concentrou praticamente toda a exposição.
É por isso que esse erro é perigoso. Ele não explode como um JOIN ruim. Ele só desloca a leitura para um lugar confortável e falso.
Onde isso aparece no trabalho real
Esse tipo de distorção costuma nascer em cenários muito comuns:
- comparar taxa de conversão entre canais e depois tirar uma média da semana;
- consolidar ticket médio de lojas com tamanhos completamente diferentes;
- juntar métricas prontas de CRM, mídia e produto em uma planilha executiva;
- calcular retenção mensal a partir de percentuais por turma sem olhar o tamanho de cada coorte;
- usar uma tabela agregada por dia ou por campanha e esquecer o denominador original.
O erro fica ainda mais provável quando a base já chega mastigada. A pessoa recebe uma planilha com taxa_conversao, ctr ou ticket_medio e trata aquilo como se fosse aditivo. Só que taxa pronta raramente é aditiva.
A pergunta certa é: o que dá peso para essa métrica?
Quando estou revisando esse tipo de número, a pergunta que mais ajuda é simples:
qual é o denominador real dessa métrica?
Se estamos falando de conversão, o peso costuma estar em sessões, usuários, leads ou oportunidades.
Se estamos falando de ticket médio, o peso está em pedidos ou transações.
Se estamos falando de retenção, talvez o peso esteja em usuários ativos de uma coorte.
Sem essa resposta, a média pode até parecer tecnicamente correta, mas a leitura de negócio continua frágil.
Por que times bons também caem nisso
Porque o erro quase sempre nasce fora da parte “difícil” do trabalho.
Não é uma modelagem super sofisticada que quebra. Muitas vezes é exatamente o contrário: alguém tenta simplificar uma consolidação para responder rápido, exporta uma tabela agregada, abre o Sheets, monta um resumo executivo e segue.
O problema é que simplificar demais uma métrica composta costuma apagar o contexto que sustentava a métrica.
Foi por isso que, em mais de uma situação, eu já vi canal pequeno parecer “o melhor da operação” só porque a taxa estava alta em cima de pouco volume. Quando o time voltava para sessões, receita ou pedidos reais, a história mudava bastante.
O jeito errado e o jeito certo em SQL
Esse erro fica visível quando a tabela já tem uma taxa calculada:
SELECT AVG(taxa_conversao) AS conversao_media
FROM performance_campanhas;
Se cada linha representa uma campanha com volumes diferentes, esse AVG está dando o mesmo peso para realidades que não são equivalentes.
O caminho mais seguro costuma ser recalcular a taxa a partir dos componentes:
SELECT
SUM(conversoes) * 1.0 / NULLIF(SUM(sessoes), 0) AS conversao_real
FROM performance_campanhas;
O mesmo vale para ticket médio:
SELECT
SUM(receita) * 1.0 / NULLIF(SUM(pedidos), 0) AS ticket_medio_real
FROM vendas_lojas;
Repare no padrão: em vez de fazer média da métrica pronta, você recompõe a métrica com o numerador e o denominador totais.
Quando a média simples pode fazer sentido
Nem toda média da média é um erro.
Se você quer comparar unidades com o mesmo peso por desenho analítico, ela pode ser uma escolha válida. Por exemplo:
- comparar a nota média de cinco lojas quando a intenção é dar o mesmo peso para cada loja, independentemente do tamanho;
- avaliar a disciplina operacional de franquias em que cada unidade deve contar igualmente;
- construir um benchmark interno em que a pergunta é “como a unidade média performa”, e não “qual foi a performance consolidada da rede”.
O ponto não é proibir a média simples. O ponto é não fingir que ela responde a mesma pergunta de uma consolidação ponderada.
Como eu costumo diagnosticar isso rápido
Quando suspeito desse erro, faço quatro checagens curtas.
1. Volto para o numerador e o denominador
Se a taxa veio pronta, tento descobrir de onde ela nasceu. Sem isso, qualquer consolidação fica vulnerável.
2. Comparo média simples com taxa recomposta
Se os dois números ficam muito distantes, quase sempre existe uma diferença relevante de peso entre os grupos.
3. Procuro os extremos
Uma campanha minúscula com conversão altíssima ou uma loja gigante com ticket menor já explicam boa parte do desvio.
4. Confirmo a pergunta de negócio
O time quer saber a performance consolidada da operação ou o comportamento médio das unidades? São perguntas diferentes e produzem números diferentes.
O impacto prático desse erro é maior do que parece
O problema da média da média não é só matemático. Ele é decisório.
Se você distorce conversão, pode redistribuir verba para o canal errado.
Se distorce ticket médio, pode superestimar o efeito de uma campanha comercial.
Se distorce retenção, pode achar que uma frente está saudável quando ela só tem uma coorte pequena performando bem.
Como esses números costumam aparecer em deck, dashboard e reunião de status, o dano não fica no relatório. Ele escorre para a decisão.
Uma regra curta que evita muita dor
Sempre que a métrica depender de uma base de exposição, desconfie de médias simples entre grupos desiguais.
Em português direto:
- taxa pede denominador;
- consolidado pede peso;
- percentual pronto nem sempre pode ser somado ou promediado sem contexto.
Essa regra não resolve tudo, mas evita muita leitura apressada que depois precisa ser desfeita na frente do time.
Resumo direto
Média da média não é um erro porque “a matemática não gosta”. Ela é um erro quando responde outra pergunta sem avisar.
Se o objetivo é entender a performance real consolidada, volte para numerador e denominador originais ou use ponderação coerente com o peso da operação. Se o objetivo é comparar unidades com o mesmo peso, assuma isso explicitamente.
O que estraga a análise não é escolher uma média ou outra. É apresentar um número como verdade operacional sem deixar claro qual pergunta ele realmente respondeu.
Se quiser reforçar essa base, estes conteúdos ajudam na sequência:
