Distribuição normal

Função densidade de probabilidade para quatro diferentes conjuntos de parâmetros; a linha verde representa a distribuição normal standard.

A distribuição normal é uma das mais importantes distribuições da estatística, conhecida também como Distribuição de Gauss ou Gaussiana. Foi desenvolvida pelo matemático francês Abraham de Moivre.

Além de descrever uma série de fenômenos físicos e financeiros, possui grande uso na estatística inferencial. É inteiramente descrita por seus parâmetros de média e desvio padrão, ou seja, conhecendo-se estes consegue-se determinar qualquer probabilidade em uma Normal.

Um interessante uso da Distribuição Normal é que ela serve de aproximação para o cálculo de outras distribuições quando o número de observações fica grande. Essa importante propriedade provem do Teorema Central do Limite que diz que "toda soma de variáveis aleatórias independentes de média finita e variância limitada é aproximadamente Normal, desde que o número de termos da soma seja suficientemente grande" (ver o teorema para um enunciado mais preciso).

Função de densidade de probabilidade

A função densidade de probabilidade da distribuição normal com média $μ$ e variância $σ 2$ (de forma equivalente, desvio padrão $σ$ ) é assim definida,

$f(x;\mu,\sigma) = \frac{1}{\sigma\sqrt{2\pi}} \, \exp \left( -\frac{(x- \mu)^2}{2\sigma^2} \right).$

Se a variável aleatória $X$ segue esta distribuição escreve-se: $X$ ~ $N (μ,σ 2)$ . Se $μ = 0$ e $σ = 1$ , a distribuição é chamada de distribuição normal padrão e a função de densidade de probabilidade reduz-se a,

$f(x) = \frac{1}{\sqrt{2\pi}} \, \exp\left(-\frac{x^2}{2} \right).$

Propriedades

Se X segue uma distribuição normal, então a X + b também segue.
Se X e Y são distribuições normais independentes, então sua soma U = X + Y, sua diferença V = X - Y ou qualquer combinação linear W = a X + b Y também são distribuições normais.

É fácil construir exemplos de distribuições normais X e Y dependentes (mesmo com correlação zero) cuja soma X + Y não é normal. Por exemplo, seja X uma distribuição normal padrão (média 0 e variância 1), então fixando-se um número real positivo a, seja Y_a definida como X sempre que |X| < a e -X sempre que |X| ≥ a. Obviamente, Y_a também é uma normal e X + Y_a é uma variável aleatória que nunca pode assumir valores de módulo acima de 2 a (ou seja, não é normal). Quando a é muito pequeno, X e Y são praticamente opostas, e sua correlação é próxima de -1. Quando a é muito grande, X e Y são praticamente idênticas, e sua correlação é próxima de 1. Como a correlação entre X e Y_a varia continuamente com a, existe um valor de a para o qual a correlação é zero.

A soma de uma grande quantidade de variáveis aleatórias (com algumas restrições) tende a uma distribuição normal - o significado mais preciso disto é o Teorema do Limite Central.
A distribuição normal é infinitamente divisível, no seguinte sentido: se X é uma variável aleatória que segue uma distribuição normal e n é um número natural, então existem n variáveis aletórias $X_1, X_2, \ldots X_n\,$ , independentes e identicamente distribuídas, tal que

$X = X_1 + X_2 + \ldots + X_n\,$

Distribuições relacionadas

$R ˜Rayleigh(σ 2)$ é a distribuição de Rayleigh se $R = \sqrt{X^2 + Y^2}$ onde $X ˜ N (0,σ 2)$ e $Y ˜ N (0,σ 2)$ são duas distribuições normais independentes.
$Y \sim \chi_{\nu}^2$ é a distribuição Chi-quadrado com $ν$ graus de liberdade se $Y = \sum_{k=1}^{\nu} X_k^2$ em que $X k ˜ N (0,1)$ para $k=0,1,\cdots,\nu$ são distribuições normais padrão independentes.
$Y ˜Cauchy(μ = 0,θ = 1)$ é a distribuição de Cauchy se $Y = X 1 / X 2$ para $X 1 ˜ N (0,1)$ e $X 2 ˜ N (0,1)$ são duas distribuições normais padrão independentes.
$Y ˜Log-N(μ,σ 2)$ é a distribuição log-normal se $Y = e X$ e $X ˜ N (μ,σ 2)$ .
Relação com Lévy skew alpha-stable distribution: se $X\sim \textrm{Levy-S}\alpha\textrm{S}(2,\beta,\sigma/\sqrt{2},\mu)$ então $X ˜ N (μ,σ 2)$ .
Distribuição normal truncada: Se $X ˜ N (μ,σ 2)$ então, truncando para valores entre $A$ e $B$ temos uma variável aleatória contínua com média $E(X)=\mu + \frac{\sigma(\phi_1-\phi_2)}{T}$ , em que $T=\Phi\left(\frac{B-\mu}{\sigma}\right)-\Phi\left(\frac{A-\mu}{\sigma}\right)$ , $\phi_1=f\left(\frac{A-\mu}{\sigma}\right)$ e $\phi_2=f\left(\frac{B-\mu}{\sigma}\right)$ , sendo $f(\cdot)$ a função densidade de probabilidade e $\Phi(\cdot)$ a função de probabilidade acumulada de uma distribuição normal padrão.

Simulação

Implementações computacionais do Método de Monte Carlo normalmente precisam simular várias variáveis aleatórias normais. Muitos programas e pacotes não conseguem simular diretamente a normal, mas têm simuladores da distribuição uniforme. Uma forma rápida e prática de gerar normais a partir da uniforme é a transformação de Box-Muller: sejam $U 1$ e $U 2$ valores independentes gerados pela distribuição uniforme entre 0 e 1. Então:

$Z_1 = \sqrt{-2 \ln U_1} \cos(2 \pi U_2)\,$

$Z_2 = \sqrt{-2 \ln U_1} \sin(2 \pi U_2).\,$

são normais padronizadas independentes.

Linguagens de programação

Várias linguagens de programação, planilhas e pacotes estatísticos incluem simulações da normal.

No Excel, não existe uma função que gere normais. Isto pode ser contornado:

Usando-se a função ALEATÓRIO() e invertendo a distribuição acumulada: INV.NORMP(ALEATÓRIO())
Com Ferramentas -> Análise de Dados -> Geração de números aleatórios, geram-se normais, que se tornam constantes na planilha

Em R (linguagem de programação), um vetor de n normais é gerado por rnorm(n).
Em Matlab e Octave, uma matriz n x n de normais é gerada por randn(n). Uma matriz m x n é gerada por randn([m n]).

FONTE DE PESQUISA: : Wikipédia, a enciclopédia livre

3°D EQUIPE :4

quinta-feira, 22 de janeiro de 2009

MATEMATICA

Distribuição normal

Função de densidade de probabilidade

Propriedades

Distribuições relacionadas

Simulação

Linguagens de programação

Nenhum comentário:

Postar um comentário

Seguidores

Arquivo do blog

Quem sou eu