miércoles, 10 de junio de 2020

4.5.2. Muestras pequeñas: prueba de Kolmogórov-Smirnov para ajuste de una distribución de probabilidades continua hipotética

prueba de Kolmogórov-Smirnov para ajuste de una distribución de probabilidades continua hipotética


En estadística, la prueba de Kolmogórov-Smirnov (también prueba K-S) es una prueba no paramétrica que determina la bondad de ajuste de dos distribuciones de probabilidad entre sí. Compara la función de distribución acumulada observada de una variable con una distribución teórica determinada, que puede ser la normal, la uniforme, la de Poisson o la exponencial.
Sirve para verificar o negar la hipótesis que un conjunto de observaciones provienen de una distribución. La estadística D que se utiliza en esta prueba es una medida de la diferencia máxima observada entre la distribución empírica y la teórica supuesta. D es una variable aleatoria. Se utiliza esta prueba para verificar o negar que un conjunto de números pseudoaleatorios tienen una distribución uniforme en el intervalo cerrado [0,1].


Ejemplo 1:
En una investigación, consistente en medir la talla de 100 niños de 5 años de edad, se desea saber si las observaciones provienen de una población normal.
Elección de la prueba estadística.
El modelo experimental tiene una muestra y es factible un arreglo en el carácter ordinal o en los rangos de las series de clases.Véase: Estadística/Flujogramas/Flujograma 1
Planteamiento de la hipótesis.
  • Hipótesis alterna (Ha). Los valores observados de las frecuencias para cada clase son diferentes de las frecuencias teóricas de una distribución normal.
  • Hipótesis nula (Ho). Las diferencias entre los valores observados y los teóricos de la distribución normal se deben al azar.
Nivel de significación.
Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza Ho.
Zona de rechazo.
Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha.
Tabla de 100 niños. Los valores X + s son 99.2 ± 2.85.
1

Aplicación de la prueba estadística.
Primero se elaboran los cálculos de los valores teóricos esperados para la distribución normal.
Inicialmente se determina el valor Z de los límites de cada clase en la serie, por ejemplo: en la primera clase se determinan el límite inferior y el superior (90 y 93), y en las subsecuentes sólo los límites superiores (97, 101, 105 y 109). Para cada valor de Z, se localiza el área bajo la curva norma tipificada. (Véase: tabla de áreas bajo la curva normal tipificada de 0 a 2).
Los cálculos de valores Z, son de la forma siguiente:
2.gif
Y así sucesivamente.
Para cada valor Z, se localiza el área de la curva tipificada de la tabla de números aleatorios. A partir de estos valores, se obtiene la diferencia entre los límites de clases entre el superior y el inferior, por ejemplo: 0.4997 – 0.4793 = 0.020, 0.4793 – 0.2357 = 0.2436, 0.2357 – (-0.2794) = 0.5151, -0.2794 – (-0.4854) = 0.206 y -0.4854 – (-0.4994) = 0.014.
Estos resultados de diferencias se multiplican por el tamaño de la muestra (100 niños), luego se obtienen las frecuencias teóricas y después se arreglan en frecuencias acumuladas.
Cálculos de los valores teóricos.
3
Las frecuencias acumuladas teóricas y las observadas se arreglan en los rangos correspondientes, como se muestra en la siguiente tabla, y posteriormente se aplica la fórmula de Kolmogorov-Smirnov.
Cálculo estadístico D de Kolmogorov-Smirnov.
4.gif
D = ft – fobs = – 0.036
La diferencia máxima D es igual a -0.049, valor que se compara con los valores críticos de D en la prueba muestral de Kolmogorov-Smirnov y se obtiene la probabilidad de la existencia de esa magnitud de acuerdo con la prueba de Kolmogorov-Smirnov. El valor N es 100 y el mayor número de N en la tabla es 35, por lo cual se aplica la fórmula al pie de la tabla:
Para la probabilidad de 5.gif
Lo anterior quiere decir que para todo valor menor que el crítico para una probabilidad de 0.05, la probabilidad correspondiente es mayor que 0.05, y todo valor mayor que D al calculado tinen una probabilidad menor que 0.05, o sea, es inversamente proporcional al crítico determinado o localizado en la tabla.
Decisión.
En virtud de lo anterior, el estadístico de Kolmogorov-Smirnov obtendo es menor que el crítico y su probabilidad mayor que 0.05, por lo tanto, se acepta Ho y se rechaza Ha.
Interpretación.
Las frecuencias observadas y las teóricas calculadas no difieren significativamente. Por lo tanto, las observaciones tienen una distribución normal.

No hay comentarios.:

Publicar un comentario

3.3 Definiciones: Replica, corrida, estado transitorio, estado estable, condiciones iniciales, reloj de la simulación

REPLICA: Las réplicas son múltiples corridas experimentales con la misma configuración de factores (niveles). Las réplicas están sujetas a l...