📐 Medidas de Dispersão
Introdução
As medidas de dispersão complementam as medidas de tendência central ao descrever o quanto os dados se espalham em torno da média ou da mediana. Duas amostras podem ter a mesma média, mas uma pode ter valores muito concentrados e outra muito espalhados — as medidas de dispersão capturam essa diferença.
Por que Medir a Dispersão?
Em loterias e análises de dados, saber apenas a média não basta. Por exemplo: a média das dezenas sorteadas pode ser 25 em dois jogos, mas no primeiro os números podem estar entre 1 e 50 (dispersos) e no segundo entre 20 e 30 (concentrados). Variância, desvio padrão, amplitude e intervalo interquartil ajudam a quantificar essa variabilidade.
Variância
A variância é a média dos quadrados dos desvios em relação à média. Ela mede o “espalhamento” dos dados: quanto maior a variância, mais dispersos estão os valores.
Fórmulas
População: σ² = Σ(xᵢ − μ)² / N
Amostra: s² = Σ(xᵢ − x̄)² / (n − 1)
μ = média populacional, x̄ = média amostral, N = tamanho da população, n = tamanho da amostra. Na amostra usamos (n−1) para obter um estimador não viesado.
Desvio Padrão
O desvio padrão é a raiz quadrada da variância. Ele tem a mesma unidade que os dados (ex.: números de 1 a 60), o que facilita a interpretação: “em média, os valores se afastam da média em X unidades”.
População: σ = √σ² | Amostra: s = √s²
Amplitude e Intervalo Interquartil
A amplitude é a diferença entre o maior e o menor valor (max − min). É simples, mas sensível a valores extremos. O intervalo interquartil (IIQ) é a diferença entre o terceiro e o primeiro quartil (Q3 − Q1) e é mais estável, pois ignora os 25% menores e os 25% maiores valores.
💡 Na prática
Em análises de loterias, desvio padrão e IIQ ajudam a ver se os sorteios estão muito “regulares” ou com variabilidade esperada. Combinar tendência central e dispersão dá uma visão mais completa dos dados.