Archive for diciembre 20th, 2013
Hoy la Sociedad de Estadística e Investigación Operativa (SEIO), como comente en la entrada anterior clausura el Año Internacional de la Estadística, y quiero poner mi granito de arena con está entrada sobre una de las cosas más importantes que tenemos que hacer antes de realizar un estudio estadístico es elegir la muestra que vamos a estudiar, para ello en estadística se utilizan los métodos de muestreo, que consisten en seleccionar una muestra partir de una población. Se utilizan para no tener que trabajar con toda la población de manera que sea más rápido y de menor coste (ahorrando dinero, trabajo y tiempo), obteniéndose una muestra verdaderamente representativa del universo, colectivo o población de estudio. En el caso de que la muestra coincidiera con la población, estaríamos hablando de un Censo o investigación exhaustiva de la población.
Si llamamos N al tamaño de la población y n al número de elementos que forman la muestra, o tamaño muestral, se denomina:
a) Fracción de muestreo: f=n/N
Indica, multiplicado por 100, el porcentaje de población encuestada.
b) Factor o coeficiente de elevación: k=1/f =N/n
Representa el número de unidades que hay en la población por cada elemento de la muestra.
EJEMPLO: El número de viviendas de un Barrio es 10.000, si tomamos una muestra de 400 viviendas, el porcentaje de encuestados es el 4%, y cada vivienda entrevistada representa a 25 viviendas del barrio.
Los métodos de muestreo se dividen en dos bloques:
Muestreo no probabilístico: no se usa el azar, sino el criterio del investigador, suele presentar grandes sesgos y es poco fiable.
Muestreo probabilístico: se utilizan las leyes del azar mediante diferentes procedimientos de muestreo que se describen a continuación:
1. Muestreo aleatorio simple (m.a.s) (es el más importante y básico): Consiste en seleccionar una muestra de tamaño n de una población de tamaño N con elementos homogéneos, de modo que cada elemento de la población tiene la misma probabilidad de ser elegido para la muestra, las observaciones se realizan con reemplazamiento, de manera que la población es idéntica en todas las extracciones, o sea , que la selección de un individuo no debe afectar a la probabilidad de que sea seleccionado otro cualquiera aunque ello comporte que algún individuos pueda ser elegido más de una vez . («se hacen tantas papeletas numeradas como individuos hay, se coge una y se devuelve, se vuelve a coger otra y se devuelv , etc.»).
También se pueden realizar sin reemplazamiento, de forma que al no ser devuelta la unidad otra vez a la población, la probabilidad de que salga unelemento depende de las extracciones anteriores, en el caso de ser una población finita.El número total de muestras posibles será igual al número de combinacionesque se pueden hacer con N elementos tomados de n en n.
Para elegir una muestra de una población finita se utilizan frecuentemente los números aleatorios (tabla elaborada para ese fin o generándolos con el ordenador).
2. Muestreo sistemático: Se utiliza cuando el número de elementos de la población es elevado y están ordenados por listas. Se toma un individuo al azar y a continuación a intervalos constantes se eligen todos los demás hasta completar la muestra. Si el orden de los elementos es tal que los individuos próximos tienden a ser más semejantes que los alejados, el muestreo sistemático tiende a ser más preciso que el aleatorio simple, al cubrir más homogéneamente toda la población. Si se sospecha que pueda presentarse algún tipo de periodicidad, se procedería a cambiar, al azar, cada cierto tiempo el punto de partida o se utilizaría el muestreo aleatorio simple.
Los intervalos constantes se calculan tomando el valor recíproco de la fracción de muestro, que recibe el nombre de factor de elevación k.
EJEMPLO: Se necesita tomar una muestra de 250 estudiantes de un colegio que cuenta con 1.000, entonces el intervalo de selección sería 4. Para iniciarla, se toma un número al azar entre 1 y 4, a partir de él, se aplica a la lista el intervalo 4. Si por ejemplo elegimos el 2, la muestra estaría compuesta por las personas 2, 6, 10, 14, 18, 22,…….
3. Muestreo estratificado: Se utiliza sobre todo en encuestas de opinión, donde los elementos (personas) son heterogéneos en razón de su sexo, edad, etc… Interesa que la muestra tenga la misma composición a la de la población la cual se divide en clases o estratos. Si por ejemplo en la población el 20% son mujeres y el 80% hombres, se mantendrá la misma proporción en la muestra. La muestra se toma asignando un número o cuota de miembros a cada estrato, esto se conoce en la literatura estadística como afijación de la muestra y escogiendo los elementos por m.a.s. dentro de cada estrato.
Existen diversos tipos de afiliación, cuya utilización depende de las características de la población a investigar, son entre otros afijación simple (es el menos recomendable, consiste en repartir la muestra total en partes iguales para cada estrato), afijación proporcional (es el más utilizado, consiste en dividir la muestra total en partes proporcionales a la población de cada estrato) , afijación óptima, óptima por costes variables, valoral, etc..
EJEMPLO: El número de viviendas de un barrio es de 10.000 y tenemos 2.000 del tipo A, 7.000 del tipo B y 1.000 del tipo C. Se realizan 400 entrevistas ¿Cómo se dividiría la muestra, utilizando la afijación proporcional?.
Si consideramos n1, n2 y n3 al tamaño de la muestra en cada uno de los estratos, tendríamos:
n1/2000=n2/7000=n3/1000=400/10000
Es decir: n1=(2000*400/10000) = 8, n2= 280 y n3 = 40
4. Muestreo por conglomerados: la muestra se obtiene al seleccionar directamente cierto número de grupos en los cuales aparecen distribuidas las unidades de la población original – llamados conglomerados – . En cada etapa del muestreo, en lugar de seleccionar elementos al azar, seleccionamos conglomerados tan homogéneos entre sí como sea posible y heterogéneos internamente como la población de estudio.
Puede ser:
a) Monoetápico: En una sola etapa
b) Bietápico: En dos etapas
c)Polietápico: generalización para un número cualquiera de etapas. Se utiliza para investigar poblaciones complejas, donde se combinan las ideas de conglomerados y estratificados con él muestro aleatorio simple entre las unidades finales del muestreo. Consiste en muestrear conglomerados dentro de cada conglomerado.
Los métodos de muestreo no probabilístico más utilizados son: Muestreo por cuotas, Muestreo por rutas aleatorias, Muestreo «bola de nieve».
Esta entrada es la tercera aportación de mi Blog en la Edición 4.123105625 del Carnaval de Matemáticas, del Carnaval de Matemáticas cuyo blog anfitrión es precisamente mi Blog Que no te aburran las M@TES
Comentarios recientes