Métodos de Muestreo en la Investigación Social: Tipos y Aplicaciones
FACTORES DETERMINANTES DEL TAMAÑO DE LA MUESTRA
-Dentro de cada gran tipo de muestreo también hay variaciones -> en los muestreos estratificados (probabilístico) se necesita un mayor tamaño de muestra, al igual que en el de cuotas (no probabilístico) -> cada uno de los subconjuntos ha de ser representativo de la población.
LOS ANÁLISIS ESTADÍSTICOS PREVISTOS
-Necesario anticipar la variedad de los análisis estadísticos que se van a hacer antes de elegir el tamaño de la muestra.
-Para análisis multivariables o análisis bivariables de tablas de contingencia se precisa un tamaño de muestra elevado -> al menos 40 casos por cada variable independiente o predictora.
-En general cuánto más se segmente la muestra, es necesario un mayor tamaño muestral para satisfacer el criterio de significatividad estadística
LA HETEROGENEIDAD POBLACIONAL
-Cuanto más heterogénea sea una población mayor será su varianza poblacional.
–A mayor varianza poblacional es necesario un mayor tamaño de muestra para que cada uno de sus diversos integrantes tengan representación en la muestra. Por el contrario, en universos homogéneos se precisan menos casos en la muestra para representar a la población.
–Si no se conoce la varianza poblacional se aplica el supuesto más desfavorable (de máxima heterogeneidad) -> valores estimados de p y q igual a 0,50 → mayor tamaño muestral.
EL NIVEL DE CONFIANZA DE LA ESTIMACIÓN
-El nivel de confianza o de probabilidad de que la estimación muestral se ajuste a la realidad, es decir, a lo que sucede en la población.
-El nivel de confianza común en la investigación social es del 95% -> por la distribución normal sabemos que en un 95% de las muestras que obtengamos el parámetro poblacional estará comprendida en un intervalo de valores que viene definido por el estadístico muestral ± 2 σ (errores típicos o desviaciones típicas) -> conceptos importantes:
- Distribución muestral de un estadístico: distribución de los valores tomados por él (en nuestro ejemplo la edad media de inicio al consumo del alcohol), en todas las muestras posibles aleatorias y de igual tamaño de la población. La distribución muestral nos da la proporción de veces que aparece un determinado valor de una media después de muchas repeticiones.
- Distribución muestral de las medias: distribución de frecuencias del estadístico, o dicho de otro modo, en cuántas muestras de esas 1.000 aparecen valores diferentes de la media
- Teorema del Límite Central: si obtenemos observaciones al azar de cualquier población, a medida que aumenta el número de observaciones, la media de los valores observados se acerca mucho a la media poblacional
- Error típico. al extraer todas las muestras posibles del mismo tamaño de una población, el error típico es lo que se separarán las medias de esas muestras posibles de la media de la población que queremos estimar.
- Nivel de confianza: utilizamos lo que ocurre después de muchas repeticiones, o lo que es lo mismo, después de extraer muchas muestras aleatorias posibles de igual tamaño, para expresar nuestra confianza en los resultados de cualquier muestra.
- Error muestral o error de estimación: las veces que el error típico que se separa la media de la población de la media de la muestra. El error muestral o de estimación, es el error que cometemos al estimar la media de la población a partir de la media que observamos en una muestra, tomando sólo la media de esa población en lugar de todas las posibles que podríamos obtener. Es la diferencia entre el estadístico y el parámetro poblacional. Es margen de variabilidad en el estadístico muestral que obtendríamos al hacer todas las muestras posibles.
-El parámetro poblacional no lo vamos a conocer pero sí podemos estimar entre qué valores se encuentra: si el 48% de lo sujetos entrevistados dice que va a votar a un determinado candidato, esto no quiere decir que el 48% exacto de la población le vaya a votar -> los intervalos de confianza indican el intervalo en el que podrían oscilar los resultados en la población a partir de lo que observamos en una sola muestra
- Se obtiene sumando y restando al estadístico muestral aproximadamente 2 veces el error típico -> si en una muestra la media de inteligencia es de 85 puntos (en una escala de 0 a 100) y el error típico es +/- 2 puntos, en la población la media de inteligencia estará entre 83 y 87.
EL MARGEN DE ERROR MÁXIMO ADMISIBLE
-El error de estimación o margen de error máximo admisible es el error o desviación posible cuando extrapolamos los resultados a partir de lo observado en la muestra -> ese +/- 2 veces el error típico que sumamos a la media de la muestra es el error de estimación.
-A mayor tamaño de muestra menor error de muestreo -> necesitaremos muestras mayores si queremos que el margen de error de los resultados sea muy pequeño (el resultado exacto lo tendríamos si respondiera el 100% y la muestra coincidiera con la población).
-Errores muestrales comprendidos entre ±2,5 y 2% son los más frecuentes. No son deseables errores superiores a 4%.
EN RESUMEN
-La decisión sobre a cuántas personas de la población vamos a entrevistar depende de varios factores.
-En los diseños probabilísticos el investigador ha de sopesar la precisión que desea con las estimaciones muestrales con el coste que tendría reducir el error muestral y aumentar el nivel de confianza de su estimación.
-En la práctica disponemos de tablas que nos identifican el tamaño de muestra necesario en función del tamaño de la población, del nivel de confianza y del margen de error tolerado -> es necesario distinguir entre poblaciones infinitas (grandes, cuyo tamaño exacto podemos desconocer) y poblaciones finitas (tamaño más reducido y que conocemos) -> 100.000 sujetos marca el umbral.
MÉTODOS DE MUESTREO
-Muestreos probabilísticos: aleatorio simple, aleatorio sistemático, aleatorio estratificado, aleatorio por conglomerados, áreas y rutas aleatorias
-Muestreos no probabilísticos: muestreo por cuotas, m. estratégico, m. circunstancial (bola de nieve)
MUESTREO ALEATORIO SIMPLE
-Existencia de un marco muestral nominativo que ayude a contactar a las unidades de la población que hayan sido aleatoriamente elegidas (nombre, dirección, número de teléfono).
-Numeración consecutiva de cada uno de los integrantes del marco muestral.
-Extracción de los integrantes de la muestra que correspondan a los números que han surgido al azar (tabla de números aleatorios o generación aleatoria de números mediante algún programa informático específico) -> los números elegibles han de ser inferiores o iguales al tamaño del marco.
-Lo usual es que cada unidad de la población puede ser sólo elegida una vez (sin reemplazamiento).
-Se aconseja extraer un número mayor de unidades que el tamaño de la muestra para asegurar las sustituciones.
-Inconvenientes:
- Requiere listar y enumerar consecutivamente a las unidades de la población del marco muestral.
- En poblaciones grandes es costoso disponer de un listado de la población y que cada unidad del marco muestral esté numerada consecutivamente -> se agiliza si los datos del
- marco muestral están en soporte magnético y se sigue un procedimiento informático de
- generación de números aleatorios.
- La dispersión alcanzada en la muestra repercute negativamente en los costes de la investigación en encuesta.
MUESTREO ALEATORIO ESTRATIFICADO
-Clasificación de la población del marco muestral en grupos o “estratos” mutuamente excluyentes con respecto a características de la población que se consideran claves en la explicación del problema de investigación.
-Los estratos han de ser internamente homogéneos y diferentes de los otros grupos.
-Los estratos se forman de acuerdo a variables que se prevé afecten a la variabilidad del problema de investigación: p. ej: por escala ideológica o edad de los padres en una investigación sobre estilos parentales.
-La elección de las variables de estratificación está condicionada a aquellas incluidas en el marco muestral:
- Las más comunes son variables sociodemográficas o variables geográficas: ámbito territorial, tipo de hábitat y tamaño de hábitat.