Los valores de las muestras que yo voy a seleccionar van a ser diferentes entre sí, y van a tener diferencias con los valores de la población, es decir, los parámetros. Esa diferencia se llama error muestral. Supongamos que sacamos varias muestras (n) de una población N
Estos valores son diferentes entre sí, porque las muestras están compuestas por diferentes elementos; entonces, si yo estoy estudiando la edad, me va a dar diferente en la muestra n1 que en n3.
El teorema central del límite me dice que si yo a estos valores los expreso en una distribución de frecuencias, voy a poder calcular la media aritmética, por ejemplo. Cada uno de los valores va a tener distintos “valores”. Estos valores tienen una determinada probabilidad de ocurrencia, es decir, van a haber promedios que se van a repetir más y otros que se van a repetir menos, a la manera de la curva normal de Gauss:
X_____
X1 p1
X2 p2
X3 p3
…
Xn pn
El teorema central del límite nos dice que esta es la distribución de mis promedios muestrales y por extensión de proporción muestral, se va a distribuir de manera normal. Van a haber promedios que se van a repetir poco y promedios que se van a repetir mucho.
Yo puedo calcular las medias aritméticas de las medidas muestrales. El teorema central del límite me dice que el promedio de medias muestrales es el promedio de la población, con una dispersión que es
δx ₌ δ/raíz de n
¿Para qué me sirve esto? Para saber si la muestra es representativa o no, porque en la realidad no voy a tener el presupuesto para sacar tantas muestras. Vamos a ver dónde cae nuestra muestra en la curva normal de Gauss. Si cae suficientemente cerca del valor poblacional, voy a decir que los valores de la muestra son buenos estimadores del valor poblacional.
Entonces: yo selecciono una muestra por los 4 métodos que habíamos visto: al azar, sistemático, estratificado proporcional y por conglomerados. Pero yo no me voy a quedar con los resultados de la muestra. Mi intención en decir algo de toda la población. Entonces quiero saber cuán cerca están los valores muestrales del valor poblacional. Si lo conozco, lo voy a comparar. Si no lo conozco, lo voy a estimar. Cuanto más grande sea la muestra, la confianza será mayor y menor el error.
No hay comentarios.:
Publicar un comentario