Distribuição normal
Função densidade de probabilidade para quatro diferentes conjuntos de parâmetros; a linha verde representa a distribuição normal standard.
A distribuição normal é uma das mais importantes distribuições da estatística, conhecida também como Distribuição de Gauss ou Gaussiana. Foi desenvolvida pelo matemático francês Abraham de Moivre.
Além de descrever uma série de fenômenos físicos e financeiros, possui grande uso na estatística inferencial. É inteiramente descrita por seus parâmetros de média e desvio padrão, ou seja, conhecendo-se estes consegue-se determinar qualquer probabilidade em uma Normal.
Um interessante uso da Distribuição Normal é que ela serve de aproximação para o cálculo de outras distribuições quando o número de observações fica grande. Essa importante propriedade provem do Teorema Central do Limite que diz que "toda soma de variáveis aleatórias independentes de média finita e variância limitada é aproximadamente Normal, desde que o número de termos da soma seja suficientemente grande" (ver o teorema para um enunciado mais preciso).
|
Função de densidade de probabilidade
A função densidade de probabilidade da distribuição normal com média μ e variância σ2 (de forma equivalente, desvio padrão σ) é assim definida,
Se a variável aleatória X segue esta distribuição escreve-se: X ~ N(μ,σ2). Se μ = 0 e σ = 1, a distribuição é chamada de distribuição normal padrão e a função de densidade de probabilidade reduz-se a,
Propriedades
- Se X segue uma distribuição normal, então a X + b também segue.
- Se X e Y são distribuições normais independentes, então sua soma U = X + Y, sua diferença V = X - Y ou qualquer combinação linear W = a X + b Y também são distribuições normais.
- É fácil construir exemplos de distribuições normais X e Y dependentes (mesmo com correlação zero) cuja soma X + Y não é normal. Por exemplo, seja X uma distribuição normal padrão (média 0 e variância 1), então fixando-se um número real positivo a, seja Ya definida como X sempre que |X| < a e -X sempre que |X| ≥ a. Obviamente, Ya também é uma normal e X + Ya é uma variável aleatória que nunca pode assumir valores de módulo acima de 2 a (ou seja, não é normal). Quando a é muito pequeno, X e Y são praticamente opostas, e sua correlação é próxima de -1. Quando a é muito grande, X e Y são praticamente idênticas, e sua correlação é próxima de 1. Como a correlação entre X e Ya varia continuamente com a, existe um valor de a para o qual a correlação é zero.
- A soma de uma grande quantidade de variáveis aleatórias (com algumas restrições) tende a uma distribuição normal - o significado mais preciso disto é o Teorema do Limite Central.
- A distribuição normal é infinitamente divisível, no seguinte sentido: se X é uma variável aleatória que segue uma distribuição normal e n é um número natural, então existem n variáveis aletórias , independentes e identicamente distribuídas, tal que
Distribuições relacionadas
- R˜Rayleigh(σ2) é a distribuição de Rayleigh se onde X˜N(0,σ2) e Y˜N(0,σ2) são duas distribuições normais independentes.
- é a distribuição Chi-quadrado com ν graus de liberdade se em que Xk˜N(0,1) para são distribuições normais padrão independentes.
- Y˜Cauchy(μ = 0,θ = 1) é a distribuição de Cauchy se Y = X1 / X2 para X1˜N(0,1) e X2˜N(0,1) são duas distribuições normais padrão independentes.
- Y˜Log-N(μ,σ2) é a distribuição log-normal se Y = eX e X˜N(μ,σ2).
- Relação com Lévy skew alpha-stable distribution: se então X˜N(μ,σ2).
- Distribuição normal truncada: Se X˜N(μ,σ2) então, truncando para valores entre A e B temos uma variável aleatória contínua com média , em que , e , sendo a função densidade de probabilidade e a função de probabilidade acumulada de uma distribuição normal padrão.
Simulação
Implementações computacionais do Método de Monte Carlo normalmente precisam simular várias variáveis aleatórias normais. Muitos programas e pacotes não conseguem simular diretamente a normal, mas têm simuladores da distribuição uniforme. Uma forma rápida e prática de gerar normais a partir da uniforme é a transformação de Box-Muller: sejam U1 e U2 valores independentes gerados pela distribuição uniforme entre 0 e 1. Então:
e
são normais padronizadas independentes.
Linguagens de programação
Várias linguagens de programação, planilhas e pacotes estatísticos incluem simulações da normal.
- No Excel, não existe uma função que gere normais. Isto pode ser contornado:
- Usando-se a função ALEATÓRIO() e invertendo a distribuição acumulada: INV.NORMP(ALEATÓRIO())
- Com Ferramentas -> Análise de Dados -> Geração de números aleatórios, geram-se normais, que se tornam constantes na planilha
- Em R (linguagem de programação), um vetor de n normais é gerado por rnorm(n).
- Em Matlab e Octave, uma matriz n x n de normais é gerada por randn(n). Uma matriz m x n é gerada por randn([m n]).
FONTE DE PESQUISA: : Wikipédia, a enciclopédia livre
Nenhum comentário:
Postar um comentário