viernes, 13 de junio de 2014

Estadística inferencial: muestreo y estimación.

Inferir: es estudiar una parte de algo y extrapolar los datos.
Hay 2 tipos:
·         Los datos de muestreo
·         La estrapolacion de los datos.
Si seleccionamos bien la muestra tenemos que tener en cuenta un error de muestreo.
  
Al conjunto de procedimientos que permiten elegir muestras de tal forma que estas reflejen las características de la población le llamamos TECNICAS DE MUESTREO.
Siempre que trabajamos con muestras tenemos que asumir ciertos errores, puesto que no estudiamos la totalidad de la población.
Si la muestra se realiza por muestreo aleatorio = al azar. La técnica de muestreo en este caso se denomina (muestreo probabilístico) muestreo probabilístico aleatorio y el error asociado a esa muestra elegida al azar se denomina ERROR ALEATORIO.
En los muestreos  no probabilísticos ni siquiera conocemos el error.
Proceso de la inferencia estadística.
Tenemos una población (ciudadanos de Sevilla 700.000)
Y quiero saber un parámetro. (Frecuencia de fumadores)
Selecciono aleatoriamente una muestra.
Y mido en la muestra el parámetro. Denominado ahora ESTIMADOR.

EJEMPLO DE INFERENCIA: quiero saber el tiempo de cura de ulceras por precion de 100 pacientes
Media del tiempo de muestra à 1º= 53.77 dias.
Media del tiempo de muestra à 2º = 57.08 días.
Si seleccionamos muchas muestras, cada una nos dará un valor distinto.
Construimos un HISTOGRAMA con los resultados de todos los resultados de los distintos estudios 1º y 2º. Y obtendremos una gráfica con la típica imagen de la campana de gauss.
Es la medida que trata de captar la variabilidad de los valores del estimador (en este caso la media de los días de curación de ulcera)
El error de cualquier estimador mide el grado de variabilidad en los valores del estimador en la distintas muestras de un determinado tamaño que pudiésemos tomar de una población.
Cuanto más pequeño es el error estándar de un estimador más nos podemos…


DEPENDE DE CADA ESTIMADOR:
ERROR ESTANDAR PARA UNA MEDIA:    S/Öh
ERROR ESTANDAR PARA UNA PROPORCION:       Öp (1-p)/h

De ambas fórmulas se deduce que mientras mayor sea el tamaño de la muestra, menor será el error estándar.

Ejemplo:
Muestra aleatoria de 100 pacientes:            h=100
Media de días:                                            x = 53.77; estimador
Desviación típica de la muestra:                           S = 22.84
Así el error estándar es =                            E e =  S/Öh   à 22.84 /Ö100 = 2.28

…………………………………………………………………………………………

Para estimadores que pueden ser expresados como suma de valores muéstrales, la distribución de sus valores sigue una distribución normal con la media de la población y desviación  típica igual al error estándar del estimador de que se trate.
Si Sigue una distribución normal, sigue los principios básicos de esta:
Es ese par de valores dentro del cual puedo decir que con una probabilidad alta el

I.C. de un parámetro = estimador ± Z (e. estándar)
Z = es un valor que depende del nivel de confianza 1- con que se quiera…

……………………………………………………………………………………………
  
Ejemplo:
Estamos interesados en conocer el consumo de cigarrillos de alumnos de centros de bachiller de nuestra localidad
Muestra aleatoria de 100 alumnos
Se observó que fumaban una media de 8 cigarrillos al día
Con una desviación típica de 4 cigarrillos en el colectivo total.
Estime el consumo medio de todos los alumnos de Bach. Con un nivel de confianza del 95%.
______________________________
h=100
S= 4
X= 8
I.c = 95%             
Z para el 95% = 1.96       E= S/Öh à E= 4Ö100 = 0.4
                            Z para el 99% = 2.58

Ic 95% = x ± Z e    à IC95% = 8± 1.96 • 0.4 = 8±0.784
                                     8+0.784=
                                     8-0.784=

  
Un centro de salud pretende hacer un estudio sobre obesidad 337 pacientes, los enfermeros realizaron el ICM y encontraron un total de 83 pacientes obesos. Calcula el intervalo de confianza la población de obesos que existe en el centro de salud.

h= 337
S=ÖS(xi-x)²/h-1
c= Sc/n

Frecuencia relativa de obesos = 83/337=0.246  (esto es el estimador)
  24.6%
Error estándar e= Öp (1-p)/h 
             

         Ö0.246 (1-0.246) 
             ___________= 0.023
                337


IC= Ic 95% = x ± Z e    = 0.246±0.023 =  1º-0.201
                                                            2º -0.291

………………………………………………………………………………………….
¿Cuál seria el intervalo de confianza para el 95% de la media de la glucemia basal?


……………………………………………………………………………………………….
Se selecciona una muestra aleatoria simple de 600 familias a las q se ¿ si algunas vez ha recibido una visita domiciliaria de enfermería 240 cont. Afirmativamente.
Obtener un intervalo de confianza del 99% para estimar la proporción real de familias que recibieron atención domiciliaría.

Se está calculando el intervalo de confianza para una proporción.

h= 600    ----- 240 visitas

c= Sc/h  --- >> 240/ 600 = 0.4  frecuencia relativa de familias que recibieron visita domiciliaria de enfermería.

P= 240/600= 0.4

Q=1-p

E=Öp*q/h=0.02                      E= Öp(1-p)/n ---- >>  0.4( 1-0.4)/600= 0.02

IC 99%= p±z*e

IC = 0.4± 2.58*0.02 =  0.34 y 0.35     [no me sale]L, no preocuparse ya saldrá.
Ic= 0.4±0.05=

………………………………………………………………………………………………

PROCEDIMIENTO MUESTRAL.
Un muestreo es un método tal que al escoger un grupo pequeño de una población podamos tener un grado…

2 técnicas de muestreo
  • Probabilísticos; existe un tanto porciento ≠ de 1 de que el muestreo sea aleatorio.
    • Aleatorio simple
    • Aleatorio sistemático
    • Estratificado
    • conglomerados
  • No probabilísticos ; no existe una probabilidad
    • Accidental
    • Por cuotas

1-   Aleatorio simple: todos los sujetos de la población tienen la misma probabilidad de ser incluidos en la muestra.
-      De sorteo o rifa: desventaja de este método es que no puede usarse cuando la población es demasiado grande.
-      Tabla de números aleatorios: + económico y requiere menor tiempo.
2-   Sistemático: similar al aleatorio simple en donde cada unidad de la población tienen la misma probabilidad de ser seleccionados
Se asigna un número aleatorio…

Ejemplo 500 pacientes diabéticos de un hosp. Se calcula un tamaño muestral de 100

Así 500/100= 5

Pues se saca un nº aleatorio… Ejemplo 325 y se cogen cada 5 … hasta completar los 100 sujetos.

3-   Estratificado: se subdivide la población en subgrupos denominados estratos. Esto se hace cuando la población presenta cierta variabilidad que pueda tener influencia sobre el estudio. Ejemplo las mediciones de TA en una población y el muestreo simple nos escoge un 85% de personas mayores de 65 años… pues la variable edad puede influir en la muestra.

TAMAÑO DE LA MUESTRA
El tamño dela muestra a tomar va a depender de:
-      Error estándar
-      De la probabilidad de error encomparar grupos que se considera importante en los valores de la variable a estudiar
-      De la variabilidad [varianza] de la variable a estudiar
Como se calcula ¿?
Depende de lo que queramos estudiar.

1-   Dependiendo si quiero estimar medias ;
la formula será: n =z al cuadrado por X por S al cuadrado /partido de e al cuadrado.
E es el error máximo aceptado por los investigadores en las diferencias entre los grupos de comparación de comparación de la variable a estudiar.
Si tras esta operación se cumple el resultado N > n (n-1) el calculo del tamaño muestral termina aquí.

………………………………………………………..
Se desea hacer una estimación sobre la edad media de una población
Calcula el tamaño de la muestra con un error menor al ….
Z=2.58 = 99%
Medio año =0.5 años
N=2.58² * 3²/0.5²=239.6
La prueba del agodonà 239.6 –redondeo a 240.
Población de 20.000 hab.
N=20000
         n*(n-1)>N
239.6 x 238.6=57168
Es mayor que N
Se hace un reajuste, si quiero estimar proporciones 

No hay comentarios:

Publicar un comentario