viernes, 13 de junio de 2014

Medidas de tendencia central, posición y de dispersión

Además de tablas y gráficos podemos resumir los datos observados mediante estadísticos de los datos observados.

De posición: indican ordenadas de menor a mayor.

Central: Indican el comportamiento general de los datos.

De dispersión: Indica la heterogeneidad de los datos.

MEDIA ARITMETICA O MEDIA: solo variables cuantitativas.
Nos indica el centro de gravedad de nuestros datos.

Media: Se calcula c= suma de la variable (Sc) / total de individuos (h)
c= Sc/n

Media aritmética: se calcula sumatorio de la marca de clase multiplicado por su frecuencia absoluta y dividiéndolo por el total de individuos del estudio.  

 c´= SMc (marca de clase) x fi/h

Esta media se calcula cuando la variable es continua y se agrupan los datos.

MEDIANA: es el valor de la observación tal que deja a un 50% delos datos por debajo y un 50% de los datos por encima.

Para calcular la mediana de un intervalo no se puede calcular y se coge Hi = frecuencia absoluta acumulada y todo lo que pasa de 0.49999 que es igual que decir 49.999%; nos indica que es el 50% por tanto es ese el intervalo mediana.

MODA: es el intervalo o variable que + se repite.

MEDIDAS DE POSICIÓN: es imprescindible ordenar los datos en orden creciente.

Cuantil: solo para variables cuantitativas, se calculan para variables cuantitativas y al = que la mediana, solo tienen en cuenta la posición delos valores en la muestra.

Los cuantiles más usuales son los percentiles, los deciles y los cuartiles, según dividan la muestra ordenada en 100, 10, o 4 partes.

Percentiles: divide la muestra en 100 partes. EL PERCENTIL “i”  [P] ES AQUEL VALOR QUE, ORDENADAS LAS OBSERVACIONES EN FORMA CRECIENTE EL [ ¡ %] DE ELLAS SON MENORES QUE EL [100-i]% RESTANTE SON MAYORES.      

          P1= 1, [por lo que en una muestra de 200 lo dividiría en 10 partes de 10].

Para buscar la posición de un percentil en una serie de datos…

Ejemplo: peso de RN en niño sano. El P: 50, se mira el Hi y se ve donde se encuentra el 0.50, entonces escogeríamos ese intervalo.

El P: 50 es la media y es igual al Q: 2, y al D: 5 el decil es multiplicar por 10 el percentil.

Deciles: divide la muestra en 10 partes

Cuartiles: divide la muestra en 4 partes.  [1º Cuartil = 25; 2º cuartil =50…], [Q1=25, Q2=50, Q3=75, Q4 = 100]
La información aportada por las medidas, son de carácter limitado.



Ejemplo:                             edades
Grupo 1
18
19
20
21
22
c=20
M1=20








Grupo 2
9
14
20
27
30
c=20
M2=20


El RANGO O RECORRIDO_ es la diferencia entre el dato de menor valor y el de más valor.
R= I ch - c1 I
Ejemplo:

R G1= I22-18 I= 4

R G2= I 30-9 I = 21


DESVIACION MEDIA: es la distancia de cada observación por la media sumada y partido del total de sujetos.


Dm G1 = (20-18)+ (20-19)+(20-20)+(21-20)+(22-20)/ 5 = 1.2 [años] esto sería que entre los sujetos hay una media de 1.2 años entre un individuo y otro.

Dm G2 = (20-9)+(20-14)…./5 = 6.8   . [años] esto sería que entre los sujetos hay una media de 6.8 años entre un individuo y otro.

Se interpreta que contra más alto sea el valor más dispersos son los datos.

DESVIACION TIPICA:


Resultados:        S G1= 1.58
S G2= 8.7

Para calcular la desviación típica en un rango: (misma formula excepto la media que se cambia por la marca de clase. 


LA VARIANZA: es el cuadrado de la desviación típica. No aporta información adicional a la desviación típica.
S² Sumatorio fi (mc-x)²/h-1
S²Sumatorio (xi-x)²/h-1

COHEFICIENTE DE VARIACION: es la desviación típica partido por la media. [ de esa serie].
CV= S/ X
Ejemplos:

Cv= 13.42/ 40.46= 0.33  
Lo que significa que estos datos tienen una variabilidad de un 33%.

Cv de G1= 1.58/20= 0.079  7% de variabilidad
Cv de G2= 8.75/20= 0.43 43% de variabilidad

Preguntas típicas de examen:
Calcular la magnitud de asociación entre las variables del estudio.
Realice con los resultados obtenidos una conclusión final a la hipótesis del estudio.

SUPUESTO:

En un estudio sobre hábitos nutricionales de estudiantes de enfermería entre 30 estudiante el dato de las edades de los mismos encontrándose los siguientes datos:

17,17,19,19,31,21,18,27,21,22,24,19,25,24,24,23,20,29,21,22,21,20,20,19,19,23,20,21.

Se pide: (y nos cayó en el examen)

-          Construir la tabla completa y correcta de frecuencias de la variable “edad”
-          Realizar la representación grafica más apropiada.
-          Calcular medidas de tendencia central, rango, desviación típica y coeficiente de variación.



DISTRIBUCIONES NORMALES: En estadística se llama distribución normal, o distribución de Gauss a una de las distribuciones de probabilidad de variable continua que con más frecuencia que con más frecu aparecen fenómenos reales.

¿Cuantas desviaciones estándares le debo sumar a la media si quiero saber dónde se sitúa el 95% de las observaciones? 

*típica pregunta de examen

La grafica de su función de densidad tiene una forma acampanada o campana de Gauss. Y el pico más alto coincide con la media, mediana y moda, pero no en todas.

Si le sumamos o restamos una desviación típica a la mediana; en ese rango se van a encontrar el 68.8% de los individuos.

Cuando la campana es asimétrica no coinciden los valores con el pico más alto de la campana.

La asimetría se indica según el lugar donde se encuentre la media. A derecha o izquierda.

El coeficiente de asimetría de una variable: grado de asimetría de una distribución de sus datos… cunando el grado es 0 quiere decir que existe = concentración de valores a la izq y al a derecha de la media.

Si el grado de asimetría es positivo: quiere decir q  es un grado de asimetría hacia la izquierda por lo que el pico va a la derecha y la moda está a la derecha.

Si el grado de asimetría es negativo: quiere decir que es un grado de asimétrico a la derecha por lo que la moda estará a la izquierda y la media quedara a la derecha de la punta de la campana de gauss.

CURTOSIS: es el coeficiente de apuntamiento de una variable, si hay mucha curtosis quiere decir que los datos están muy apelotonados. En una distribución normal el grado de curtosis es 0.

Grado 0= distribución mesocurtica
Grado >0; +0= leptocurtica, presenta un elevado grado de concentración alrededor de los valores centrales de una variable.
Grado <0; -0= platicurtica, lo contrario de la leptocurtica.


No hay comentarios:

Publicar un comentario