Modelos Probabilísticos: Distribuição Normal (Gaus ou Gaussiana) a Curva do Sino e suas Propriedades
A Distribuição Normal (ou Distribuição de Gauss ou Gaussiana) trata-se de uma importante ferramenta das distribuições na estatístico. Ela descreve vários fenômenos e é muito utilizada na estatística inferencial. Por meio das já conhecidas média e desvio padrão podemos definir as probabilidades em uma Distribuição Normal. Assim, somente com o uso e calculo de médias e desvio padrão poderemos trabalhar com a distribuição de Gauss.
Para melhor compreendermos a distribuição normal, devemos caracterizar o “evento aleatório”. Esse trata-se de evento em que a ocorrência individual não possui padrões que possibilitem a realização de previsões corretas. podemos citar como exemplo o lançamento de um dado ou variações no preço de uma ação.
Estatisticamente, apesar da ocorrência individual de certos eventos aleatórios serem imprevisíveis l de forma objetiva, podemos tirar algumas conclusões com base em um conjunto suficientemente grande deles. Por diversas vezes os eventos aleatórios quando analisados em conjunto apresentam padrões que não são passíveis de serem observados considerando a variável insoladamente, tais como a tendência dos eventos se concentrar próximos a certa posição da média matemática deles. Portanto, o número de eventos diminui constante e gradativamente à medida que nos afastamos da média.
Assim, a Distribuição normal visa determinar probabilidades dos eventos aleatórios quanto a certo padrão que pode ser identificado quando observados em conjunto. O modelo gráfico da distribuição normal possui forma de sino (inclusive um dos nomes da distribuição normal é Curva do Sino ou, em inglês, Bell Curve) e é completamente determinada pela média e desvio padrão da amostra ou população que está tendo suas probabilidades estudadas.
Destaca-se que a curva normal é unimodal e simétrica, o valor (ou elemento da amostra ou população) de maior ocorrência, ou seja a moda coincide com o valor da média e da mediana.
Vejamos exemplos de algumas Curvas Normais:
Gráfico de Curva Normal com Médias Diferentes e Mesmo Desvio-Padrão.
Gráfico de Curva Normal com Médias Iguais e Desvio-Padrão Diferente.
Pelos gráficos podemos notar que o desvio padrão refere-se a abertura da curva normal e podemos afirmar que quanto mais aberta, mais disperso são as probabilidades do evento ocorrer com relação a sua média. O desvio padrão representa a dispersão dos elementos das séries com relação a média aritmética dessa mesma. Portanto, sabendo a média e o desvio-padrão poderemos por meio da curva normal conhecer a probabilidade dos eventos ocorrerem.
A curva de Gauss nos dará a probabilidades de se afastar da média da população ou amostra analisada em quantidade de desvios-padrão. Destaca-se que os estatísticos criaram tabelas de probabilidades para a Curva Normal. Por exemplo, veja nos gráficos abaixo que:
- No gráfico 1 a probabilidade de ocorrência de valores no intervalo de média menos 1 desvio-padrão até média mais 1 desvio-padrão é de 68,28%.
- No gráfico 2 probabilidade de ocorrência de valores no intervalo de média menos 2 desvios-padrão até média mais 2 desvios-padrão é de 95,44%.
Gráfico 1 Gráfico 2
[box title=”Probabilidade no intervalo da Curva Normal” color=”#2930e0″]Na Curva de distribuição Normal a probabilidade será definida pela área de certo intervalo da curva normal. O cálculo da área envolve complexos cálculos algébricos, exigindo o uso de cálculo numérico. No entanto, a área da curva normal, com já dissemos, possui seus cálculos já parametrizados pelos estatísticos. Assim, podemos afirmar que, por exemplo:
O intervalo compreendido entre a “média – 1 desvio-padrão” e a “média + 1 desvio-padrão” tem área (probabilidade) de 68,28%;
O intervalo compreendido entre a “média – 2 desvios-padrão” e a “média + 2 desvios-padrão” tem área (probabilidade) de 95,44%.;
O intervalo compreendido entre a “média -3 desvios-padrão” e a “média +3 desvios-padrão” tem área (probabilidade) de 97,3%;
Destaca-se que essas medidas são tabeladas e compreendem a regra empírica, ou a regra dos 3-sigmas.
[/box]Vejamos agora um exemplo de distribuição
Suponhamos que o Marcelo planta acerolas possuindo uma grande quantidade destas plantas para comercialização de sua produção. Identificou-se que existe uma distribuição de frequência de curva normal quanto à altura de sua plantação com média de 85 cm e desvio padrão de 5 cm.
Neste caso montando o gráfico e fazendo as análises para as árvores com alturas entre 85 cm e com desvio padrão de 5 cm podemos dizer:
Vejamos agora o gráfico referente aos pinheiros com alturas contidas no intervalo entre 75 cm até 95 cm: