Distribuição Binomial

📊 Estatística⏱️ 15 min de leitura📅 Última atualização: 14/01/2025

Introdução

A distribuição binomial é uma das distribuições de probabilidade mais importantes e amplamente utilizadas na estatística. Ela descreve o número de sucessos em uma sequência de n tentativas independentes, cada uma com probabilidade p de sucesso. Este artigo apresenta uma análise completa e profunda da distribuição binomial, incluindo sua teoria, aplicações práticas e exemplos detalhados.

O que é a Distribuição Binomial?

A distribuição binomial é uma distribuição de probabilidade discreta que modela o número de sucessos em n tentativas independentes, onde cada tentativa tem apenas dois resultados possíveis: sucesso (com probabilidade p) ou falha (com probabilidade 1-p).

Condições para Distribuição Binomial

Para que uma situação seja modelada por uma distribuição binomial, devem ser atendidas as seguintes condições:

  • 1. Número fixo de tentativas (n): O experimento consiste em n tentativas idênticas
  • 2. Dois resultados possíveis: Cada tentativa resulta em sucesso ou falha
  • 3. Probabilidade constante (p): A probabilidade de sucesso p é a mesma em cada tentativa
  • 4. Independência: As tentativas são independentes entre si

Fórmula da Distribuição Binomial

A função de probabilidade da distribuição binomial é dada por:

Função de Probabilidade

P(X = k) = C(n,k) × pᵏ × (1-p)ⁿ⁻ᵏ
P(X = k) = (n! / (k! × (n-k)!)) × pᵏ × (1-p)ⁿ⁻ᵏ
  • X: Variável aleatória (número de sucessos)
  • k: Número de sucessos (0, 1, 2, ..., n)
  • n: Número de tentativas
  • p: Probabilidade de sucesso em cada tentativa
  • C(n,k): Coeficiente binomial (combinações)

Notação e Parâmetros

Notação Padrão

X ~ Binomial(n, p)

Lê-se: "X segue uma distribuição binomial com parâmetros n e p"

Parâmetros da Distribuição

Parâmetro n

Número de tentativas: Deve ser um número inteiro positivo. Determina quantas tentativas independentes são realizadas.

Parâmetro p

Probabilidade de sucesso: Deve estar entre 0 e 1 (0 ≤ p ≤ 1). Representa a probabilidade de sucesso em cada tentativa individual.

Média e Variância

As medidas de tendência central e dispersão da distribuição binomial são:

Estatísticas Fundamentais

Média (Valor Esperado)

E[X] = μ = n × p

O número esperado de sucessos em n tentativas.

Variância

Var(X) = σ² = n × p × (1-p)

Mede a dispersão dos valores em torno da média.

Desvio Padrão

σ = √(n × p × (1-p))

Raiz quadrada da variância.

Exemplos Práticos Detalhados

Exemplo 1: Lançamento de Moeda

Um dos exemplos mais simples e didáticos da distribuição binomial:

Problema

Lançamos uma moeda justa 10 vezes. Qual é a probabilidade de obter exatamente 6 caras?

Solução

  • • n = 10 (número de lançamentos)
  • • p = 0.5 (probabilidade de cara em cada lançamento)
  • • k = 6 (número de caras desejado)
  • • P(X = 6) = C(10,6) × (0.5)⁶ × (0.5)⁴
  • • P(X = 6) = 210 × 0.015625 × 0.0625
  • • P(X = 6) = 210 × 0.0009765625 ≈ 0.205

Portanto, a probabilidade de obter exatamente 6 caras em 10 lançamentos é aproximadamente 20,5%.

Exemplo 2: Controle de Qualidade

Problema

Em uma linha de produção, 5% dos produtos são defeituosos. Se inspecionarmos 20 produtos aleatoriamente, qual é a probabilidade de encontrar exatamente 2 produtos defeituosos?

Solução

  • • n = 20 (número de produtos inspecionados)
  • • p = 0.05 (probabilidade de defeito)
  • • k = 2 (número de defeituosos desejado)
  • • P(X = 2) = C(20,2) × (0.05)² × (0.95)¹⁸
  • • P(X = 2) = 190 × 0.0025 × 0.3972
  • • P(X = 2) ≈ 0.189

A probabilidade de encontrar exatamente 2 produtos defeituosos é aproximadamente 18,9%.

Exemplo 3: Taxa de Sucesso em Loterias

Problema

Suponha que a probabilidade de uma pessoa ganhar um prêmio em uma loteria seja de 0.01 (1%). Se 100 pessoas participam, qual é a probabilidade de exatamente 3 pessoas ganharem?

Solução

  • • n = 100 (número de participantes)
  • • p = 0.01 (probabilidade de ganhar)
  • • k = 3 (número de ganhadores desejado)
  • • P(X = 3) = C(100,3) × (0.01)³ × (0.99)⁹⁷
  • • P(X = 3) ≈ 0.061

A probabilidade de exatamente 3 pessoas ganharem é aproximadamente 6,1%.

Propriedades e Características

Forma da Distribuição

A forma da distribuição binomial depende dos valores de n e p:

p = 0.5

Distribuição simétrica em torno da média

p < 0.5

Distribuição assimétrica à direita (viés negativo)

p > 0.5

Distribuição assimétrica à esquerda (viés positivo)

Propriedades Importantes

Principais Propriedades

  • Valores possíveis: X pode assumir valores de 0 até n
  • Soma de probabilidades: Σ P(X = k) = 1 (soma de k = 0 até n)
  • Simetria: Se p = 0.5, a distribuição é simétrica
  • Máxima variância: Ocorre quando p = 0.5
  • Reprodução: A soma de variáveis binomiais independentes também é binomial

Função de Distribuição Acumulada

A função de distribuição acumulada (CDF) fornece a probabilidade de que X seja menor ou igual a k:

Fórmula da CDF

F(k) = P(X ≤ k) = Σ P(X = i) para i = 0 até k

A CDF acumula todas as probabilidades de 0 até k.

Aproximações e Limites

Aproximação pela Distribuição Normal

Para grandes valores de n, a distribuição binomial pode ser aproximada pela distribuição normal:

Condições para Aproximação Normal

  • • n × p ≥ 5 (esperança de sucessos)
  • • n × (1-p) ≥ 5 (esperança de falhas)

Quando essas condições são atendidas, podemos usar:

X ≈ N(n×p, n×p×(1-p))

Aproximação pela Distribuição de Poisson

Quando n é grande e p é pequeno, podemos aproximar a binomial pela Poisson:

Condições para Aproximação Poisson

  • • n ≥ 20
  • • p ≤ 0.05 (ou n×p ≤ 5)

Nessas condições, podemos usar λ = n×p:

X ≈ Poisson(λ = n×p)

Aplicações Práticas

Áreas de Aplicação

  • Controle de Qualidade: Número de itens defeituosos em amostras
  • Pesquisas e Enquetes: Número de respostas favoráveis
  • Medicina: Número de pacientes que respondem a um tratamento
  • Marketing: Número de clientes que fazem uma compra
  • Engenharia: Número de componentes que falham em testes
  • Finanças: Número de investimentos bem-sucedidos
  • Análise de Dados: Modelagem de eventos binários

Limitações e Cuidados

⚠️ Quando NÃO Usar a Distribuição Binomial

  • Amostragem sem reposição: Use distribuição hipergeométrica
  • Probabilidade variável: Se p muda entre tentativas
  • Tentativas dependentes: Se as tentativas não são independentes
  • Mais de dois resultados: Use distribuição multinomial
  • Número de tentativas variável: Use distribuição geométrica ou binomial negativa

Testes Estatísticos

A distribuição binomial é usada em vários testes estatísticos:

  • Teste Binomial: Testa se uma proporção é igual a um valor específico
  • Teste de Sinal: Testa se a mediana é igual a um valor específico
  • Teste de McNemar: Testa associações em tabelas 2×2 pareadas

Conclusão

A distribuição binomial é uma ferramenta fundamental e poderosa na estatística, especialmente útil para modelar situações onde temos um número fixo de tentativas independentes, cada uma com dois resultados possíveis.

Compreender profundamente a distribuição binomial permite modelar uma ampla variedade de fenômenos reais, desde controle de qualidade até pesquisas de opinião. A chave para usar efetivamente a distribuição binomial está em verificar cuidadosamente se todas as condições necessárias são atendidas em sua situação específica.

Lembre-se: a distribuição binomial assume tentativas independentes com probabilidade constante de sucesso. Se essas condições não forem atendidas, considere distribuições alternativas como a hipergeométrica ou a Poisson, dependendo do contexto.