domingo, 21 de novembro de 2010

Frequência -distribuição de frequências;medidas de tendência central,-média -mediana e moda

FREQUÊNCIA - Uma informação útil que podemos extrair de um conjunto de dados numéricos é o numero de vezes que cada um deles aparece.
ex. uma lista de 100 notas obtidas em um teste psicotécnico para futuros motoristas.

Organizando a lista temos:

60
61   61  61  61
62
63  63  63
64  64  64                 9 nº 64
65  65  65                 6 nº 65
66  66  66                10 nº 66
67  67  67                15 nº 67
68  68  68                17 nº 68
69  69  69                12 nº 69
70  70  70                  9 nº 70
71  71  71                  6 nº 71
72  72   72
73
74  74
75

A simples observação dessa lista organizada permite tirar algumas conclusões a respeito dos resultados obtidos no exame.

a maior nota foi 7,5  e a menor  6,0

a nota que mais aparece é 6,8

a nota 7,0 aparece 9 vezes,  etc.
Chamamos de frequência o nº de vezes que um determinado dado aparece em uma lista numérica qualquer.

              EX-       Teste psicotécnico         tabela de frequência

nota -60  61  62  63  64  65  66  67  68  69  70  71  72  73  74  75
Fi     - 1    4    1    3    9    6  10  15  17  12    9    6    3    1    2    1

Observe que, nesse caso, temos 16 notas diferentes, cada uma delas associada a uma frequência. A soma de todas as frequências fornece o total de notas da lista


Resumindo: se chamarmos os intervalos de classe e as frequências de classe de fi teremos a seguinte distribuição de frequências para uma coleção de n dados

              CLASSE                        Fi
               a 1- a 2                          f1
               a2-  a3                           f2
                 .
  .        _______                           fi
            ai 1 - ai
               = h
             
MEDIDAS de DE TENDÊCIA CENTRAL:

-MEDIA

Para um determinado conjunto de dados, podemos definir diversos tipos de médias. A Média aritmética é a mais usada.

MÉDIA A PARTIR DA DISTRIBUIÇÃO DE FREQUÊNCIA

Para determinar a média a partir de uma  distribuição de frequências, relativa a uma coleção x (i=1,2,3,...n)de n dados, procedemos da seguinte forma :
- determinamos o ponto médio x de cada um dos K intervalos de  classe;
- multiplicamos cada x, pela frequência de classe fi correspondente.


MEDIANA

A mediana é também uma medida de tendência central calculada tomando-se como critério a divisão do conjunto de dados em duas partes , com o mesmo nº de valôres. O cálculo da mediana, portanto, tem como objetivo determinar O VALOR QUE OCUPA A POSIÇÃO CENTRAL em uma coleção de valôres, ordenados de forma crescente

Seja a coleção de 11 valôres a seguir

3  9  11  12  13   14  44   16    19    21    22
                             |

                       mediana = 14
O grupo fica dividido em dois blocos com o mesmo nº de elementos.


Suponha agora que a coleção seja de 8 elementos

118  120  132  140  150  150  162   164
                        140 + 150 : 2
mediana = 145


MODA

Deternminamos a moda de uma coleção pelo elemento que mais aparece na coleção

8   12   12   11   9   6   11   12   13   14   6   8

Como se vê o elemento que mais se repetiu foi o  nº 12 por isso ele é a moda.


Nesta coleção podemos calcular A MÉDIA, A MEDIANA E A MODA

Classe                        fi            Média  = 5,5
 0-4                            3
 4-8                            6           Mediana = 5,0
 8 -12                         2
12-16                         5         
16-20                         4          Moda =  5,0
20-24                         8                       
24-28                       10
28-32                         5
32-36                         7


Como  pudemos mostrar,a estatística está interessada nos métodos científicos para coleta , organização ,sumarização, apresentação e análize de dados bem como na obtenção de conclusões em tais análises. Em sentido mais restrito, o termo é usado para designar os próprios dados ou numeros deles derivados como,por exemplo a média, a mediana etc como pudemos ver.

POPULAÇÃO E AMOSTRA. ESTATÍSTICA INDUTIVA  e DESCRITIVA
Ao em vez de estudar todo o universo por exemplo toda a produção de parafusos fabricados em determinado espaço, examina uma pequena parte chamada amostra.
Uma população pode ser finita ou infinita. Ex. a população de todos os parafusos produzidos numa fábrica em um dia ( finita ) enquanto que a população constituida de todos os resultados ( cara ou coroa ) em sucessivos lances de uma moeda é infinita.
Essa parte que trata das condições sob as quais essa inferências são válidas chama-se estatística indutiva . Como essas inferencias não pode ser absolutamente certa, a linguagem da probabilidade é muitas vezes usada, no estabelecimento das conclusoes.
A parte da estatística que procura somente descrever e analisar um certo grupo, é chamada estatística dedutiva
VARIÁVEL CONTÍNUA e DISCRETA
Uma variável é um simbolo como X, Y, Z... que pode assumir qualquer valor que lhe é atribuído conjunto esse chamado domínio da variável. Se a variável pode assumir apenas um valor é chamada de constante.
Será contínua quando pode assumir qualquer valor entre dois dados,; de outro modo denomina -se variável discreta.

ARREDONDAMENTO DE DADOS
Para se fazer o arredondamento o mais pratico é por exemplo 72,8 o mais próximo inteiro é 73
outro 72,8146 o aredondamento para centézimo mais proximo é 72,81 o 46 sendo < que 5 fica mais proximo de 81 que de 82. outro  o 72,465 para centézimo deparamoscom um dilema 72,46 dista igualmente  72,47 . Usa-se na prática em tais casos aproximar para o numero par que precede o 5 Assim o 72,465 fica 72,46. o 183,575 fica 183,58  etc...

NOTAÇÃO CIENTÍFICA
 Ao escrever números, especialmente aqueles que comportem muitos zeros , antes ou depois da virgula. é conveniente empregar a notação científica que utiliza potencias  de dez.
Exemplo  10¹ = 10 ; 10² = 100  ...10° = 1  10-¹= 0,1    10¬³ = 0,001 ...
             864000 000 = 8,64 X 10 elevado a 8ª potencia ; 0,00003416 = 3,416 X 10 elevado a -5
OBS - Note que multiplicando a virgula se desloca para `a direita, ( e a portencia é positiva)
             dividindo a virgula se desloca para a esquerda, (e a potencia é negativa )
Muitas vezes emprega-se parenteses ou pontos para indicar a multiplicação de dois ou mais numeros
(5)(4)= 5.4=20 10.10.10 = 1000. Quando se empregam letras para representar os numeros, os parenteses ou os pontos são muitas vezes omitidos.
A notação científica é muitas vezes útil no cálculo, especialmente para localizar a virgula.
10² . 10³ = copia-se a base 10 e somam-se os expoentes 2 e 3.
10 ³ : 10 ² = copia-se a base 10 e subtrai-se os expoentes 3 e 2

ALGARISMOS SIGNIFICATIVOS - Se uma altura foideterminada com precisão como 1,66 m , isto significa que seu valor verdadeiro está compreendido entre 1,655 e 1,665 m. Os algarismos  corretos, separados  dos zeros necessários para a localização da virgula , chamam-se algarismos significativos ou digitos significativos do número.
Exemplos - 1,66 =3 algarismos significativos.
                  4, 5300 = 5 algarismos significativos
                  0,0018 = 1,8 X 10'³ tem 4 algarismos significativos
Os numeros resultantes de numeração ou de contagens, ao contrário dos das medições , são naturalmente exatos e, assim, tem uma quantidade ilimitada de algarismos significativos. Em alguns destes casos, contudo, pode ser difícil decidir quais são os algarismos significativos sem informações adicionais.por ex. o numero 186 000 000 pode ter 3, 4, ... 9 algarismos significativos. Se se souber que ele tem 54 algarismos significativos , será melhor escrever o numero 186,oo milhões ou 1,8600 X 10 a 8ª potencia.

CALCULOS
AO efetuar cálculos que envolvem multiplicação, divisão e extração de raízes de números , o resultado final não pode ter mais algarismos significativos do que o que tem  menor quantidade deles .
Ex. 73,24 X 4,52 = 331           ( 1,648 / 0,023 = 72 )    ( V38,7 = 6,22)       ( 8,416 . 50 ) = 420,8 SE 50 É EXATO.
         
                                      DATA DESTA POSTAGEM     (   23/5/2012)

SERIES OU DISTRIBUIÇÕES ESTATÍSTICAS - série estatística é um nome que se atribui  a um conjunto de dados estatísticos distribuídos segundo as diversas modalidades do fenômeno que representam
por exemplo estatura, distribuição territorial, distribuição específica ...
SERIAÇÃO OU DISTRIBUIÇÃO POR FREQUÊNCIA - Quando os dados são distribuídos de acordo com a sua grandeza em ordem crescente ( ou decrescente) obedecendo gradações convenientes , pois, o tempo, o local, e a categoria permanecem fixos. Nestas séries aparece o importante problema da tabulação , de grande aplicação no campo da Estatística e onde os dados são dispostos em classes oportunas .
               exemplo - COMPOSIÇÃO DEMOGRÁFICA DE    X   CIDADE  2000
                   Idades               Pontos médios               frequência
                 (classes )                 das classes                 ( por 100.000 hb.)

           de  0  a 10 anos                5                              20 208
          de 10  a 20 anos              15                              20 306
          de 20  a 30 anos              25                              21 939
          de 30  a 40 anos              35                              16 588
          de 40  a 50 anos              45                              10 433
          de 50  a 60 anos              55                                6 056
          de 60  a 70 anos              65                                2 996
          de 70  a 80 anos              75                                1 082
          de 80  a 90 anos              85                                   295
          de 90  a100anos              95                                     79
          de 100 a mais                  ---                                     18

              total                                                              100 000


LEVANTAMENTO ESTATÍSTICO - é a operação que possibilita estudar os universos estatísticos ,determinando a tendência característica de seus dados. As principais fases de um levantamento estatístico são ;  a- coleta de dados    b- Disposição dos dados , tabulação e distribuição por frequência  c- Análise das distribuições por frequência  d - Conclusões sobre os resultados obtidos.
A - COLETA DE DADOS - È o primeiro trabalho que poderá ser feito pelo próprio organizador ou por terceiros , Em qualquer dos casos ( direto ou indireto ) os dados devem ser em totais que possam justificar a divulgação que se queira dar aos resultados ( o tamanho mínimo da amostra representativa deve ser de 10%  do universo que se estuda )
B- DISPOSIÇÃO DOS DADOS , estes  são dispostos num quadro ou tabela inicial denominada tabela primitiva. Em seguida, procura-se imprimir uma certa ordem aos dados que facilite o estudo dos mesmos.
Se os dados foram medidas é comum dispô-lo por ordem de grandeza ( crescente ou decrescente ) constituindo assim uma nova tabela, agora denominada ROL.
Os dados que compõem o rol passam a ser seus termos .
Logo depois vem a fase da tabulação. Tabular significa registrar o numero de vezes que cada termo aparece na tabela primitiva ou rol. Chamando frequência absoluta ou simplesmente frequência ao numero de vezes de cada termo figura no rol , podendo dizer , também , que tabular é registrar a frequência de cada termo no rol.
Com essa finalidade procuramos reunir todos os termos do rol em convenientes grupos denominados classes , a fim de melhor distribuir as frequências.
Cada classe tem por extremo dois números que são denominados limites da classe. O menor limite inferior  l(i) o outro limite superior l(s).
Chama-se amplitude de classe ou intervalo unitário de uma classe a diferença entre os limites superior e inferior dessa classe. ( h )
AMPLITUDE TOTAL ou intervalo total da uma distribuição de frequência é a diferença entre o maior e o menor figurante na distribuição . Isto significa que o l(i) e o l (s) que definem a amplitude total, podem deixar de constar como dados do rol. Indicação ( A ). É  evidente que dividindo o valor da amplitude total ( A ) pelo valor que representa a amplitude de classe ( h ) , comum a todas, obteremos o numero de classes da distribuição. É comum ao formarmos as classes , surgir o valor inferior de uma sendo também o valor superior da outra classe exemplo Digamos que na nossa frequência surjam de 150   a  155, de 155 a 160, de 160 a 165...
Surge então a pergunta : A que classe pertence o dado 155, à primeira ou a segunda classe ?Com a  notação usada podemos  , desde já, situar o valor 155 ( que é limite superior da primeira classe) , na 2º classe como seu limite inferior . Como vimos no exemplo  o  (h) = 5      o   X = 150 a155., 155 a 160 ...
Ponto médio ( P m) é o numero que se obtém quando se soma o limite inferior de uma classe a metade de sua amplitude.     ( 150 + 155) : 2  = 152,5 , 157,5, 162,5 ,...
OUTRO TIPOS DE FREQUÊNCIA - 1) Frequência  ACUMULADA - Acumular frequências  numa distribuição, significa somar cada frequência (absoluta) com a soma das que lhe são anteriores na distribuição. ( Fa)
2- Frequência RELATIVA  é o quociente da divisão de cada frequência ( absoluta ) pela frequência total.indicada por F(r)
Multiplicando-se cada frequência relativa po 100, obteremos a frequência relativa percentual. Indicada por f %.
 Ficando assim por exemplo.
 h =5           X          Pm            F          Fa          Fr              F%
           150 a 155    152,5         6           6          0,150          15,0
           155 a 160    157,5         9          15         0,225          22,5
           160 a 165    162,5       16          31         0,400          40,0
           165 a 170    167,5         5          36         0,125          12,5
           170 a 175    172,5         3          39         0,075            7,5
           175 a 180    177,5         1          40         0,025            2,5
                                 soma F=40                  Fr=1,000   F%=100,0
NOTA - é evidente  que :
1- A soma de todas as frequencias  é igual a unidade
2- A soma de todas as frequências relativas percentuais é = a 100.
 É possível agora responder a pergunta - Quantas pessoas de estatura inferior a 165 existem nesta pesquisa
31 ( entre 160 a 165 há 31 pessoas que representam 40% do total
Que porcentagem representa sobre as demais pessoas ,aquelas pessoas que possuem estaturas superiores a 175? 2,5%
Que porcentagem representam as demais pessoas com menos de 1,70?  90% porque as menores somam 10%   ( 7,5+2,5= 10%).
A MODA =  de 160 a 165 = 16 pessoas
MEDIANA = 10,5
MÉDIA ARITMÉTICA = 161,625 cm    ( soma dos pontos médios X frequência dividido por soma das frequências )   ex. 152,5 X 6  + 157,5 X 9  +  .......  = 6465,0 : 40 = 161,625cm.            

  











                
             







































Nenhum comentário:

Postar um comentário