Estatística, uma visão introdutória

A Estatística é uma ciência que utiliza teorias probabilísticas para explicação de eventos, estudos e experimentos. Tem por objetivo obter, organizar e analisar dados, determinar as correlações que apresentem, tirando delas suas consequências para descrição e explicação do que passou e previsão e organização do futuro.

A Estatística é também uma ciência e prática de desenvolvimento de conhecimento humano através do uso de dados empíricos. Baseia-se na teoria estatística, um ramo da matemática aplicada. Na teoria estatística, a aleatoriedade e incerteza são modeladas pela teoria da probabilidade. Algumas práticas estatísticas incluem, por exemplo, o planejamento, a sumarização e a interpretação de observações. Porque o objetivo da estatística é a produção da “melhor” informação possível a partir dos dados disponíveis, alguns autores sugerem que a estatística é um ramo da teoria da decisão.

Definição

A palavra estatística surge da expressão em Latim statisticum collegium (palestra sobre os assuntos do Estado), de onde surgiu a palavra em língua italiana statista, que significa “homem de estado”, ou político, e a palavra alemã Statistik, designando a análise de dados sobre o Estado. A palavra adquiriu um significado de coleta e classificação de dados, no início do século 19.

Nós descrevemos o nosso conhecimento (e ignorância) de forma matemática e tentamos aprender mais sobre aquilo que podemos observar. Isto requer:

• O planejamento das observações por forma a controlar a sua variabilidade (concepção do experimento)

• Sumarização da coleção de observações

• Inferência estatística – obter um consenso sobre o que as observações nos dizem sobre o mundo que observamos

Em algumas formas de estatística descritiva, nomeadamente em data mining, os segundo e terceiro passos tornam-se normalmente mais importantes que o primeiro.

A probabilidade de um evento é freqüentemente definida como um número entre zero e um. Na realidade, porém, nunca há situações que tenham probabilidades 0 ou 1. Você pode dizer que o sol irá certamente nascer na manhã, mas e se acontecer um evento extremamente difícil de ocorrer que o destrua? E se ocorrer uma guerra nuclear e o céu ficar coberto de cinzas e fumaças?

Normalmente aproximamos a probabilidade de alguma coisa para cima ou para baixo porque elas são tão prováveis ou improváveis de ocorrer, que é fácil de reconhecê-las como probabilidade de um ou zero.

Entretanto, isto normalmente leva a desentendimentos e comportamentos perigosos, porque as pessoas não conseguem distinguir entre, e.g., uma probabilidade de 10^-4 e uma probabilidade de 10^-9, a despeito da grande diferença prática entre elas. Se você espera cruzar a estrada cerca de 105 ou 106 vezes na sua vida, então reduzindo a risco de cruzar a estrada em 10^-9 irá fazer você seguro pelo resto da sua vida, enquanto um risco de cruzá-la em 10^-4 irá fazer ser bem provável que você tenha um acidente, mesmo com o sentimento intuitivo que 0,01% é um risco muito baixo.

Algumas ciências usam a estatística aplicada tão extensivamente que elas tem uma terminologia especializada. Estas disciplinas incluem:

• Bioestatística
• Estatística Comercial
• Estatística Econômica
• Estatística Engenharia
• Estatística Física
• Estatística Populacional
• Estatística Psicológica
• Estatística Social (para todas as ciências sociais)
• Análise de Processo e Quimiometria (para análise de dados da química analítica e da engenharia química)

Estatística forma uma ferramenta chave nos negócios e na industrialização como um todo. É utilizada a fim de entender sistemas variáveis, controle de processos (chamado de “controle estatístico de processo” ou CEP), para sumarização de dados, e para tomada de decisão baseada em dados. Em nessas funções ela é uma ferramenta chave, e é a única ferramenta segura.

Ligações para estatística observacional fenômeno são coletados pelos Fenômenos Estatísticos

• Estatística Inferencial é o conjunto de técnicas utilizadas para identificar relações entre variáveis que representem ou não relações de causa e efeito.

• Estatística Robusta é o conjunto de técnicas utilizadas para atenuar o efeito de outliers e preservar a forma de uma distribuição tão aderente quanto possível aos dados empíricos.

A base da estatística e sua definição

A Estatística é uma ferramenta matemática que nos informa sobre o quanto de erro nossas observações apresenta sobre a realidade pesquisada. A estatística baseia-se na medição do erro que existe entre a estimativa de quanto uma amostra representa adequadamente a população da qual foi extraída. Assim o conhecimento de teoria de conjuntos, análise combinatória e cálculo são indispensáveis para compreender como o erro se comporta e a magnitude do mesmo. É o erro (erro amostral) que define a qualidade da observação e do delineamento experimental. A faceta dessa ferramenta mais palpável é a Estatística Descritiva. A descrição dos dados coletados é comumente apresentado em gráficos ou relatórios e serve tanto a prospecção de uma ou mais variáveis para posterior aplicação ou não de testes estatísticos bem como a apresentação de resultados de delineamentos experimentais.

A estatística descritiva é um ramo da estatística que aplica várias das muitas técnicas usadas para sumarizar um conjunto de dados. De certa forma estamos tentando descrever ou sumarizar as características dos dados que pertencem a esse conjunto.

Técnicas

As técnicas usadas costumam classificar-se como:

1. Gráficos descritivos. Gráficos são usados para sumarizar os dados.

2. Discrição Tabular, na qual usamos tabelas para sumarizar os dados

3. Descrição Paramétrica, na qual estimamos os valores de certos parâmetros os quais assumimos que completem a descrição do conjunto dos dados.

Objetivos dos parâmetros

1. Podemos querer escolher um parâmetro que nos mostre como as diferentes observações são semelhantes. Os textos acadêmicos costumam chamar a este objetivo de medida de tendência central.

2. Podemos querer escolher parâmetros que nos mostrem como aquelas observações diferem. Costuma chamar-se a este tipo de parâmetros de “medidas de dispersão estatística”.

Para encontrar soluções numéricas para essas questões, devemos lançar mão de um arsenal lógico-dedutivo matemático, traduzindo a realidade em número e analisando-os sob os auspícios da informação/conhecimento que se deseja obter, de forma impessoal e não tendenciosa.

Assim sendo, a estatística nos fornece parametrizações e, em última análise, modelagens do mundo que nos cerca, produzindo grupos de dados sumarizadores, que municiam estrategicamente o gestor de sistemas, estruturas e processos, com o intuito de otimizar a eficiência de sua prática e a de seus colaboradores; os cidadãos, para terem uma visão mais clara do meio social no qual está inserido e até mesmo a humanidade inteira, para descobrir seu presente e tentar prever seu futuro.

Deixe uma resposta

O seu endereço de email não será publicado Campos obrigatórios são marcados *

*

*

Top