|
||||||
|
Como analisar de forma simples um grande número de dados? Uma multinacional planeja instalar sua próxima fábrica no Brasil. A escolha da localização desta fábrica depende de informações. Os seus executivos desejam saber, entre outras coisas, se há ou não mão-de-obra especializada na região; qual é a renda média dos moradores para desenvolver uma política de salários; e qual a capacidade de consumo do mercado brasileiro, pois disso dependerá o preço final de suas mercadorias. Da mesma maneira, um pesquisador que reúne muitos dados sobre uma determinada população tem, em seguida, de agrupá-los e classificá-los, ou 'trabalhar' esses dados. Esses dados 'trabalhados' podem ser usados nos estudos de determinadas situações e acontecimentos. Trata-se de um método de análise e elaboração científica dos dados, que chamamos de Estatística. 1. Estatística descritiva
As pesquisas realizadas para estudar nível de instrução, religião ou preferência musical são exemplos de variáveis qualitativas. Já as pesquisas que envolvem estatura, número de habitantes e idade são exemplos de variáveis quantitativas. 2. Freqüências absolutas
Perguntamos, numa classe de 40 alunos, as notas que eles obtiveram em uma prova de Matemática. Recebemos como resposta as notas do quadro ao lado. O conjunto das notas obtidas na prova de Matemática é o que chamamos de dados estatísticos numéricos.
Podemos, agora, fazer uma tabela de duas colunas mostrando os dados e sua freqüência. À esquerda, colocamos as notas e, à direita, as freqüências absolutas respectivas:
A soma das freqüências da tabela acima é 40. Observe como esta cifra coincide com o número total de dados. A soma de todas as freqüências absolutas é o número total de elementos da população, que é indicado pela letra n. 3. Freqüência acumulada
Quantos alunos obtiveram nota abaixo de 5?
Agora nos perguntamos quantos alunos obtiveram uma nota menor ou igual a 7.
Para responder de maneira mais simples a esse tipo de pergunta (quantos alunos obtiveram uma nota menor ou igual a 7), vamos criar uma nova coluna correspondente à da freqüência acumulada na tabela anterior de freqüências absolutas (Figura 1, abaixo).
Quantos alunos mereceram uma nota
Como indica a Tabela de freqüências absoluta e acumulada:
5. Gráficos Muitas vezes, no entanto, queremos ter uma visão generalizada e rápida. Por isso, os gráficos estatísticos são muito úteis para entender e comparar várias tabelas de freqüências. Continuando com o mesmo exemplo empregado até aqui, vamos agora apresentar graficamente os dados. Podemos fazê-lo de várias formas. As mais comuns são: o diagrama de barras, o histograma, o pictograma e o gráfico de setores.
O diagrama de barras ou colunas é utilizado na apresentação de variáveis qualitativas. Ele é composto por retângulos dispostos verticalmente (em colunas) ou horizontalmente (em barras).
Supondo uma pesquisa de preferência esportiva de um grupo de 30 pessoas, podemos obter o seguinte gráfico de colunas:
Os histogramas são diagramas de barras utilizados para variáveis quantitativas. São formados por retângulos justapostos. A freqüência correspondente a cada classe ou intervalo é representada pela superfície de um retângulo, cuja base, situada no eixo horizontal, é limitada pelos valores extremos. A altura de cada retângulo é proporcional à freqüência de cada classe ou intervalo.
Medimos a estatura dos 40 meninos e meninas da classe de nosso exemplo anterior. As medidas obtidas, em centímetros, como mostra a tabela abaixo são:
Como as alturas são muito diferentes e quase não coincidem umas com as outras, vamos agrupá-las em intervalos. É o que mostra a tabela abaixo:
Em seguida, representamos esses dados na Tabela de freqüências II, abaixo, e no histograma (Figura 3, abaixo).
Dado um histograma, se unirmos os pontos médios das extremidades superiores de cada um dos retângulos, obteremos uma linha poligonal chamada polígono de freqüências, como a Figura 4, abaixo:
Outra forma de representar dados estatísticos é o pictograma.
São gráfico circulares, como o da Figura 6, abaixo, utilizados para representar determinada população:
Dividimos os 360 graus do ângulo central do círculo proporcionalmente às freqüências. Como a soma das freqüências é 40, faremos corresponder este número a 360º (Figura 6). À freqüência dos altos corresponderão:
À freqüência dos médios corresponderão:
À freqüência dos baixos corresponderão:
6. Estatísticas ajustadas e confiáveis A resposta para essa questão é positiva: as estatísticas podem continuar confiáveis. Vamos comprová-la com o seguinte caso:
Um gerente de vendas de uma livraria resolve impressionar seu chefe para obter um aumento de salário. Para tanto, elabora um gráfico estatístico das vendas realizadas no ano anterior, como mostra a tabela abaixo.
O resultado é apresentado no gráfico da Figura 7, abaixo:
O efeito visual desse gráfico, com certeza, não é muito impactante. Ele indica, ao contrário do desejado, que as vendas permaneceram praticamente estáveis durante todo o ano. Com ele, qualquer pretensão de aumento salarial não se justificaria.
Mas o gerente de vendas não se dá por vencido. Ele faz um segundo gráfico, usando os mesmos dados, que mostra uma imagem completamente diferente (Figura 8, acima). Esse gráfico, sem dúvida, é muito mais favorável aos seus interesses do que o anterior. E, embora ele apresente os dados de outra maneira (ampliando e focalizando apenas o espaço de vendas entre 700 mil e 750 mil exemplares), não é menos fiel à realidade do que o gráfico da Figura 6. 7. Medidas de posição central e de dispersão
A média aritmética de vários números é obtida somando-se todos e dividindo a soma entre o total de dados. Ela é representada por X.
As idades dos alunos de uma classe são:
Calcule a idade média dos alunos dessa classe.
Portanto, a idade média dos alunos é:
Quando calculamos a média de vários números, pode acontecer de alguns cálculos terem grandes desvios da média e outros apresentarem desvios mínimos.
As idades de 7 alunos de uma classe são: A idade média desse grupo é:
As idades de um segundo grupo de alunos são:
A idade média do grupo é:
Quanto se desviam da média as idades de um e de outro grupo? As diferenças entre as idades do primeiro grupo e a média são: 1, 1, 0, 0, 0, 1 e 1. As diferenças entre as idades do segundo grupo e a média são: 2, 2, 1, 0, 1, 2 e 2. Como no segundo grupo, as diferenças entre as idades em seus valores absolutos são maiores, as idades correspondentes apresentam um desvio maior em relação à média. Portanto, no segundo grupo a dispersão de idades é maior. Por outro lado, as idades dos alunos do primeiro grupo estão mais concentradas nas proximidades da média.
O cálculo da dispersão é importante, já que nos permite estabelecer qual grupo é mais ou menos homogêneo.
No caso da média, os valores extremos influem muito e podem produzir uma informação falsa. Portanto, torna-se necessário introduzir outra medida: a mediana.
As notas dos alunos de uma classe são:
Organizando essas notas em ordem crescente, temos:
Como achamos a mediana nas séries de dados de números pares?
Consideram-se os dois valores centrais e a mediana será o valor médio dos dois números centrais:
Corresponde ao termo que tem maior freqüência numa série de valores.
Na série de valores 0, 2, 5, 3, 3, 1, 2, 3, 0, 7, 3, 5 a moda é 3, já que o número 3 tem maior freqüência, pois aparece 4 vezes.
Como vimos anteriormente, a soma dos desvios de uma série sempre será igual a zero. Procurando contornar isso, os matemáticos decidiram elevar ao quadrado cada um desses desvios. Para tanto, fizeram o cálculo do valor médio, acharam as diferenças entre os valores observados e o valor médio (desvio). Finalmente, elevaram ao quadrado as diferenças obtidas e as somaram.
Chama-se variância ao quociente entre o valor desta soma (das diferenças obtidas entre os valores observados e o valor médio, ou desvio, elevadas ao quadrado) e o número n de elementos da série, que é indicada pela letra V ou pelo símbolo A variância tem um inconveniente: seu valor fica muito grande ou, ao contrário, muito pequeno. Além disso, a dispersão é dada no quadrado da unidade dos dados. Assim, para obter um dado na mesma unidade de medida, definiu-se uma outra medida de dispersão: o desvio padrão.
O desvio padrão é a raiz quadrada do valor da variância. Ele é indicado por DP ou pela letra grega
Portanto:
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| Estamos adequando nosso conteúdo ao Acordo Ortográfico da Língua Portuguesa |
Klicknet ©Copyright 2000-2006 Klicknet S.A. Todos os direitos reservados