« ESTUDOS E ANÁLISE DE MERCADOS 3 | Entrada | COMUNICAÇÃO EMPRESARIAL 12 »
april 26, 2005
ESTUDOS E ANÁLISE DE MERCADOS 4
Conceitos Básicos
Introdução
O termo Estatística provem da palavra Estado e foi utilizado originalmente para denominar levantamentos de dados cuja finalidade era orientar o Estado em suas decisões.
Estátistica
Conceitos Básicos
IntroduçãoO termo Estatística provêm da palavra Estado e foi utilizado originalmente para denominar levantamentos de dados cuja finalidade era orientar o Estado em suas decisões.
Neste sentido foi utilizado em épocas remotas para determinar o valor dos impostos cobrados dos cidadãos, para determinar a estratégia de uma nova batalha em guerras que se caracterizavam por uma sucessão de batalhas. (Era fundamental aos comandantes saber de quantos homens, armas cavalos etc- disponham após a última batalha.)
Atualmente, a estatística é definida da seguinte forma:
Estatística: Conjunto do métodos e processos quantitativos que serve para estudar e medir os fenômenos coletivos.A estatística teve acelerado desenvolvimento a partir do século XVII, com os estudos de BERNOULLI, FERMAT, PASCAL LAPLACE. GAUSS, GAUTON, PEARSON, FISHE, POISSON e outros que estabeleceram suas características atuais.
Ela não alcançou ainda um estado definitivo. Continua a progredir na razão direta do desejo da investigação dos fenômenos coletivos.
A Estatística é considerada por alguns autores como Ciência no sentido do estudo de urra população. É considerada como método quando utilizada como instrumento por outra Ciência.
A Estatística mantém com a matemática uma relação de dependência, solicitando-lhe auxilio, sem o qual não poderia desenvolver-se.
Com as outras Ciências mantém a relação de complemento, quando utilizada como instrumento de pesquisa. Em especial esta última é a relação que a Estatística mantém com a
Administração, Economia, Ciências Contábeis, servindo como instrumento auxiliar na tomada de decisões.
Conceitos Fundamentais
OBJETIVO: É objetivo da Estatística extrair informação dos dados para obter uma melhor compreensão das situações que representam.
POPULAÇÃO E AMOSTRA
População: Coleção de unidades individuais, que podem ser pessoas ou resultados experimentais, com uma ou mais características comuns, que se pretendem estudar.
Exemplo 1: Relativamente à população constituída pelos alunos da 3º série do 2º grau de uma determinada escola , podemos estar interessados em estudar as seguintes características populacionais:
- Altura (em cm) dos alunos:
Depois de medir a altura de cada aluno, obteríamos um conjunto de dados com o seguinte aspecto:
145, 161, 158, 156, 146, ... ,140, 139, 162
- Notas obtidas na disciplina de Português, no 1º período:
10, 15, 13, 16, 9, 11, 10, ... , 18, 11, 13, 8
Quando não é possível estudar, exaustivamente, todos os elementos da população, estudam-se só alguns elementos.
Amostra: Conjunto de dados ou observações, recolhidos a partir de um subconjunto da população, que se estuda com o objetivo de tirar conclusões para a população de onde foi recolhida.
Parâmetro: Uma característica numérica estabelecida para toda uma população.
Estimador: Uma característica numérica estabelecida para uma amostra.
Exemplo 2: no fenômeno coletivo eleição para prefeito na cidade de Curitiba, a população é o conjunto de todos os eleitores habilitados na Cidade. Um parâmetro é a proporção de votos do candidato A. Uma amostra é um grupo de 1000 eleitores selecionados em toda a Cidade.
Um estimador é a proporção de votos do candidato A obtida na amostra.
Em aplicações efetivas, o número de elementos componentes de uma amostra é bastante reduzido em relação ao número de elementos componentes da população.
Processos Estatísticos de Abordagem
Quando solicitados a estudar um fenômeno coletivo podemos optar entre os seguintes processos estatísticos:
a) Censo
b) Estimação
Censo: é uma avaliação direta de um parâmetro, utilizando-se todos os componentes da população.
Estimação: é uma avaliação indireta de um parâmetro, com base em um estimador através do cálculo de probabilidades.
Propriedades Principais:Censo: Estimação
• Admite erro processual zero e tem confiabilidade 100%.
• É caro.
• É lento.
• É quase sempre desatualizado.
• Nem sempre é viável. • Admite erro processual positivo e tem confiabilidade menor que 100%.
• É barata.
• É rápida.
• É atualizada.
• É sempre viável.
COMENTÁRIO:
Estatisticamente, a precisão de um valor numérico é avaliada através do binômio: confiança e erro processual.
Se admitirmos que podemos retirar do Censo todo tipo de erro de natureza humana (erro de cálculo de avaliação, de anotação etc.), restará apenas outro tipo de erro devido ao procedimento empregado.
Este erro é chamado erro processual. No caso de um Censo, o erro processual é zero, pois avaliamos um por um, todos os elementos componentes da População.
Como o erro processual na avaliação é zero, a confiabilidade no parâmetro obtido é 100%. A precisão, no Censo é total.
Na estimação, como avaliamos apenas parte e não todos os elementos que compõem a população, admitimos um erro processual positivo na avaliação do valor numérico e por conseqüência uma confiabilidade menor que 100%, sendo, portanto, menos precisa que o Censo.
Como o número de elementos que compõem uma amostra é consideravelmente menor que o número de elementos que compõem uma População, a Estimação é sempre bem mais barata que o Censo, é concluída mais rapidamente que o Censo e, portanto, mais atualizada.
Se a maneira de avaliar um elemento é um teste destrutivo, o Censo se torna um processo inviável, pois destruiria a população objeto do estudo.
Entretanto, na maioria das vezes em que o Censo é considerado inviável é por razões econômicas e de tempo.
Na sociedade moderna, a maioria dos problemas exigem decisões de curto prazo. Por isso, as informações estatísticas úteis a resolução destes problemas devem ser obtidas rapidamente.
Pela rapidez e facilidade da obtenção destas informações, a estimação tem sido cada vez mais utilizada como procedimento estatístico.
Dados Estatísticos
Normalmente, no trabalho estatístico o pesquisador se vê obrigado a lidar com grande quantidade de valores numéricos resultantes de um Censo ou de uma estimação.
Estes valores numéricos são chamados dados estatísticos.
No sentido de disciplina, a Estatística ensina métodos racionais para a obtenção de informações a respeito de um fenômeno coletivo, além de obter conclusões válidas para o fenômeno e também permitir tomada de decisões, através de dados estatísticos observados.
A estatística pode ser dividida em duas áreas:
a) Estatística Descritiva: parte da Estatística que descreve os dados observados.
b) Estatística Indutiva: parte da Estatística que obtém e generaliza conclusões para a população a partir de uma amostra, através do cálculo de probabilidade.
Estatística Descritiva
As atribuições da Estatística Descritiva são as seguintes:
a) A obtenção dos dados estatísticos.
b) A organização dos dados.
c) A redução dos dados.
d) A representação dos dados.
e) A obtenção de algumas informações que auxiliam a descrição do fenômeno observado.
• A obtenção ou coleta de dados:
Normalmente é feita através de um questionário ou de observação direta de uma população ou amostra.
• A organização dos dados:
Consiste na ordenação e crítica quanto à correção dos valores observados, falhas humanas, omissões, abandono de dados duvidosos etc.
• Redução dos dados: O entendimento e compreensão de grande quantidade de dados através da simples leitura de seus valores individuais é uma tarefa extremamente árdua e difícil mesmo para o mais experimentado pesquisador.
A Estatística descritiva apresenta duas formas básicas para a redução do número de dados com os quais devemos trabalhar, chamadas variável discreta e variável contínua.
• A representação dos dados: Os dados estatísticos podem ser mais facilmente compreendidos quando apresentados através de representação gráfica, o que permite uma visualização instantânea de todos os dados.
OBS: Os gráficos, quando bem representativos, tornam-se importantes instrumentos de trabalho.
É ainda atributo da Estatística Descritiva a obtenção de algumas informações como médias, proporções, dispersões, tendências, índices, taxas, coeficientes, que facilitam a descrição dos fenômenos observados. Isto encerra as atribuições da Estatística Descritiva.
Completando o processamento estatístico, no caso de uma Estimação, a Estatística Indutiva estabelece parâmetros a partir de estimadores usando o cálculo de probabilidade. Esta última etapa será desenvolvida posteriormente.
Dados Brutos Quando fazemos n observações diretas em um fenômeno coletivo ou observamos as respostas a uma pergunta em uma coleção de n questionários, obtemos uma seqüência de n valores numéricos.
A esta seqüência damos o nome de dados brutos.
Representando por X a característica observada no fenômeno coletivo ou na pergunta dos questionários, então x1 representa o valor da característica obtida na primeira observação do fenômeno coletivo ou o valor da característica observado no primeiro questionário; x2 representa o valor da característica X na segunda observação do fenômeno coletivo ou o valor da característica X observada no segundo questionário e assim sucessivamente.
Desta forma, os dados brutos podem ser representados por
X: x1, x2, x3, ...,xn
Esta seqüência de valores assim obtida apresenta-se completamente desordenada. De modo geral, podemos afirmar que:
Dados brutos é uma seqüência de valores numéricos não organizados, obtidos diretamente da observação de um fenômeno coletivo.
Rol
Quando ordenamos na forma crescente ou decrescente, os Dados Brutos passam a se chamar Rol.
Portanto:
Rol é uma seqüência ordenada dos Dados Brutos.
Exemplo: No final do ano letivo, um aluno obteve as seguintes notas bimestrais em Matemática: 4; 8; 7,5; 6,5.
Neste exemplo, X representa nota bimestral e pode ser apresentada na forma:
Dados Brutos: X: 4;, 8; 7,5; 6,5.
ou
Rol: X: 4; 6,5; 7,5; 8.
Séries Estatísticas
Apresentação de Dados Estatísticos
Quando lidamos com poucos valores numéricos, o trabalho estatístico fica sensivelmente reduzido. No entanto, normalmente teremos que trabalhar com grande quantidade de dados.
Um dos objetivos da Estatística Descritiva neste caso, é obter uma significativa redução na quantidade de dados com os quais devemos operar~ diretamente. Isto pode ser conseguido modificando-se a forma de apresenta. ção destes dados.
Suponha que observamos as notas de 30 alunos em uma prova e obtivemos os seguintes valores:
X: 3,5; 5; 4,5; 4; 4,5; 5; 3,5; 4; 4; 5; 2; 3; 45; 35; 4~4,5; 3; 4; 3; 4; 35; 35; 3,5; 4; 4; 3; 4; 4; 5; 3. (1)
Se entendermos como freqüência simples de um elemento o número de vezes que este elemento figura no conjunto de dados, podemos reduzir significativamente o número de elementos com os quais devemos trabalhar.
Para isto organiza-se o conjunto de dados na forma de uma série estatística chamada variável discreta.Distribuição de Freqüência: Variável Discreta
É uma representação tabular de um conjunto de valores em que colocamos na primeira coluna em ordem crescente apenas os valores distintos da série e na segunda coluna colocamos os valores das freqüências simples correspondentes.
OBSERVAÇÕES:
- Note que a colocação de um índice i para x e para f tem a finalidade de referência. Deste modo, x1 representa o primeiro valor distinto da série, x2 representa o segundo valor distinto da série, f1 representa a freqüência simples do primeiro valor distinto da série, f2 representa a freqüência simples do 2º valor distinto da série e assim sucessivamente.
- Note que conseguimos reduzir de 30 elementos que constituíam a série original para apenas 12 elementos.
- Note também que a variável discreta só é uma forma eficiente de redução dos dados, quando o de elementos distintos da série for pequeno.
Devemos optar por uma variável discreta na representação de uma série de valores quando o número de elementos distintos da série for pequeno.
Distribuição de Freqüência: Variável Contínua Suponha que a observação das notas de 30 alunos em uma prova nos conduzisse aos seguintes valores:
X: 3; 4; 2,5; 4; 4,5; 6; 5; 5,5; 6,5; 7; 7,5; 2; 3,5; 5; 5,5; 8; 8,5; 7,5; 9; 9,5; 5; 5,5; 4,5; 4; 7,5; 6,5; 5; 6; 6,5; 6
Observando estes valores notamos grande número de elementos distintos, o que significa que neste caso a variável discreta não é aconselhável na redução de dados.
Nesta situação é conveniente agrupar os dados por faixas de valores
Esta apresentação da série de valores é denominada variável contínua.
Devemos optar por uma variável contínua na representação de uma série de valores quando o número de elementos distintos da série for grande.
Construção da Variável DiscretaA construção de uma variável discreta é bastante simples. Basta servar quais são os elementos distintos da seqüência, ordená-los, e colocálos primeira coluna da tabela. Em seguida computar a freqüência simples cada elemento distinto e colocá-la na segunda coluna da tabela.
Exemplo de construção de uma variável discreta:
A seqüência abaixo representa a observação do número de acidentes por dia, em uma rodovia durante 20 dias.
X: 0, 2, 0, 1, 1, 0, 0, 0, 3, 2, 1, 0,1, 2, 0, 1, 3, 2, 2, 0.
Os valores distintos da seqüência são: 0,1, 2, 3. As freqüências simples respectivas são: 8, 5, 5, 2.
Portanto, a variável discreta representativa desta seqüência é:
xi fi
0 8
1 5
2 5
3 2
Construção da Variável Contínua
A construção da variável contínua requer o conhecimento de alguns conceitos que vamos estabelecer aproveitando a tabela abaixo como exemplificação:
Classe Intervalo de Classe fi
1 2 4 4
2 4 6 12
3 6 8 10
4 8 10 4
• AMPLITUDE TOTAL DE UMA SEQUÊNCIA
É a diferença entre o maior e o menor elemento de uma seqüência, isto é:
At = Xmax - Xmin
Onde:
Xmax é o maior elemento da seqüência X,
Xmin ,é o menor elemento da seqüência X
No exemplo da seqüência que deu origem a tabela (2), temos,
Xmax = 9,5 e Xmin = 2,
logo,
At = 9,5 - 2 = 7,5
A amplitude total representa o comprimento total da seqüência e é dada na mesma unidade de medida dos dados da seqüência.
• INTERVALO DE CLASSE: é qualquer subdivisão da amplitude total de uma série estatística.No exemplo da tabela (2) subdividimos a amplitude total em quatro classes, obtendo os intervalos de classe 2 4, 4 6, 6 8, 8 10.
Note que na realidade não trabalhamos com At = 7,5 e sim com a amplitude total ajustada para 8 como justificaremos adiante.
• LIMITE DE CLASSE: cada intervalo de classe fica caracterizado por dois números reais. O menor valor é chamado limite inferior da classe e será indicado por l. O maior valor é chamado limite superior da classe e será indicado por L. Por exemplo, na classe 2 4,l = 2 e L = 4.
• AMPLITUDE DO INTERVALO DE CLASSE: é a diferença entre o limite superior e o limite inferior da classe. Se usarmos h para representar a amplitude do intervalo de classe podemos estabelecer:
h = L - l
OBSERVAÇÕES:
- Na realidade, as classes não precisam necessariamente ter a mesma amplitude como no exemplo acima. Porém, sempre que possível, devemos trabalhar com classes de mesma amplitude. Isto facilita muito os cálculos posteriores.
- Note que usamos para representar as classes, intervalos reais semiabertos à direita. Isto significa que o intervalo contém o limite inferior, mas não contém o limi te superior, ou seja, o intervalo de classe 2 4 contém os valores reais maiores ou iguais a 2 e menores que 4.
- Desta forma, o último intervalo da série que é 8 10 não contém o valor 10. É por isso que não utilizamos a amplitude 7,5, pois se isto fosse feito, o limite superior da última classe seria 9,5 e como o limite superior não deve pertencer à classe, o elemento 9,5 da seqüência estatística original ficaria sem classificação.
- Como vamos utilizar este critério, precisaremos ajustar sempre o valor máximo da série ao definir a amplitude total.
- Outros critérios poderiam ser adotados como o intervalo real semiaberto à esquerda ou mesmo o intervaIo real aberto, mas nenhum destes critérios é melhor que o critério adotado.
• NÚMERO DE CLASSES: o número de classes a ser utilizado depende muito da experiência do pesquisador e das questões que ele pretende responder com a variável contínua.
Publicado por james stewart às april 26, 2005 10:47 EM