📐 Medidas de Dispersão

📊 Estatística Descritiva⏱️ 12 min de leitura📅 Última atualização: 14/01/2025

Introdução

As medidas de dispersão complementam as medidas de tendência central ao descrever o quanto os dados se espalham em torno da média ou da mediana. Duas amostras podem ter a mesma média, mas uma pode ter valores muito concentrados e outra muito espalhados — as medidas de dispersão capturam essa diferença.

Por que Medir a Dispersão?

Em loterias e análises de dados, saber apenas a média não basta. Por exemplo: a média das dezenas sorteadas pode ser 25 em dois jogos, mas no primeiro os números podem estar entre 1 e 50 (dispersos) e no segundo entre 20 e 30 (concentrados). Variância, desvio padrão, amplitude e intervalo interquartil ajudam a quantificar essa variabilidade.

Variância

A variância é a média dos quadrados dos desvios em relação à média. Ela mede o “espalhamento” dos dados: quanto maior a variância, mais dispersos estão os valores.

Fórmulas

População: σ² = Σ(xᵢ − μ)² / N

Amostra: s² = Σ(xᵢ − x̄)² / (n − 1)

μ = média populacional, x̄ = média amostral, N = tamanho da população, n = tamanho da amostra. Na amostra usamos (n−1) para obter um estimador não viesado.

Desvio Padrão

O desvio padrão é a raiz quadrada da variância. Ele tem a mesma unidade que os dados (ex.: números de 1 a 60), o que facilita a interpretação: “em média, os valores se afastam da média em X unidades”.

População: σ = √σ²   |  Amostra: s = √s²

Amplitude e Intervalo Interquartil

A amplitude é a diferença entre o maior e o menor valor (max − min). É simples, mas sensível a valores extremos. O intervalo interquartil (IIQ) é a diferença entre o terceiro e o primeiro quartil (Q3 − Q1) e é mais estável, pois ignora os 25% menores e os 25% maiores valores.

💡 Na prática

Em análises de loterias, desvio padrão e IIQ ajudam a ver se os sorteios estão muito “regulares” ou com variabilidade esperada. Combinar tendência central e dispersão dá uma visão mais completa dos dados.