Diseño de Cuestionarios y Técnicas de Muestreo para Investigación
El Cuestionario: Herramienta Clave en la Recogida de Información Cuantitativa
El cuestionario es una pieza clave en la recogida de información cuantitativa. Traslada a las preguntas los objetivos específicos de la investigación para recoger información estructurada sobre una muestra de personas, usando tratamientos estadísticos y así contrastar relaciones entre variables de la investigación. Homogeniza la información.
Pasos para la Elaboración de un Cuestionario
- Qué información se necesita: Para delimitar objetivos se puede consultar a expertos, analizar información secundaria y casos de situaciones similares, y utilizar técnicas cualitativas como entrevistas en profundidad para extraer las claves del tema estudiado.
- Tipo de cuestionario:
- Estructurado: Para investigaciones descriptivas y causales, se usan escalas y preguntas cerradas. Se puede auto administrar, la información se analiza cuantitativamente y es fácil de responder.
- Semiestructurado: En investigaciones exploratorias y concluyentes, se usan escalas y preguntas abiertas y semiabiertas. Es necesaria la presencia del investigador, útil cuando hay variedad de respuestas.
- No estructurado: En investigaciones exploratorias, no se infiere en resultados, presencia de investigador, preguntas abiertas e información usada cualitativamente.
- A quién preguntarás: Es vital definir claramente el perfil adecuado para que la información sea de calidad.
- Dar contenido a las preguntas: Deben ser claras y se deben formular con mucha precisión y en lenguaje cercano a la población estudiada para una mayor implicación de estos.
- Estructurarlas: Introducción atractiva, luego preguntas más relevantes y acabar con datos de clasificación. Se puede usar la técnica del embudo que es empezar con preguntas generales y de ahí pasar a las específicas.
- Pruébalo: Analízalo y elimina las no relevantes porque luego es difícil corregirlos.
Pretest del cuestionario: Cuando se ha diseñado el cuestionario, se elige una pequeña muestra para probar su funcionamiento. Se debe realizar en las mismas condiciones que el definitivo, y su buen desarrollo permite mejorar el cuestionario (la redacción de preguntas, reducir su extensión, cambiar el orden…). Se recomienda hacerlo de forma secuencial e ir comprobando las modificaciones que se van introduciendo.
Muestreo: Selección de la Muestra Representativa
El muestreo permite identificar los elementos que poseen información relevante para el problema de investigación. Surge ante la imposibilidad de realizar estudios sobre toda la población por la escasez de recursos.
Pasos para el Muestreo
- Determinar la información necesaria.
- Definir la población/tamaño.
- Elegir la técnica que usarás (probabilístico o no).
Definición de Población
Al hablar de población hay que tener claros varios conceptos:
- Elementos y Unidades de Muestreo: Hace referencia al objeto que manifiesta unas características sobre las que se quiere obtener información.
- Marco Muestral: Es una base de datos que identifica la población y sin ella, no se puede delimitar la muestra. Ej: base de datos de clientes de una empresa que te permite extraer la muestra.
- Extensión: Límites geográficos que se considerarán en el estudio.
- Tiempo: Periodo en el que se recoge la información.
Tipos de Muestreo Probabilístico
- Aleatorio Simple: Hay que conocer el tamaño de la muestra, en la base de datos se enumeran todos los elementos (ej: del 1 a 10000). Con un generador de números aleatorios como Excel, se extraen aleatoriamente hasta completar el tamaño de la muestra. Ventaja: permite proyectar los datos de la población, sencillo. Desventaja: pueden salir elementos de un mismo subgrupo.
Sistemático: Divide la población en intervalos del tamaño de la muestra deseada y genera un número aleatorio menor o igual al intervalo. Se seleccionan los individuos de cada intervalo a partir del número mediante un coeficiente de elevación al que se llega dividiendo la población entre el tamaño de la muestra. Se garantiza que no todos los elementos pertenezcan a un mismo subgrupo.
Estratificado: La población queda dividida por un estrato (variable clasificatoria). Se extrae un número determinado de unidades de cada estrato y así evitas una sobrerrepresentación de uno de los grupos. Se pueden crear varios estratos y luego extraer por aleatorio simple cada uno de sus elementos hasta completar el tamaño de la muestra.
- Estratificado Simple: No se tienen en cuenta las proporciones de elementos que pertenecen a cada estrato.
- Estratificado Proporcional: Sí las tienen en cuenta.
Por Conglomerados: Se asume que no hay diferencias entre conglomerados. Si se estudia el consumo de comida en un país, se considera que la región no es un elemento determinante de tener gustos diferentes por lo que a diferencia de los estratificados, no habría que marcar diferencia entre regiones. Al dividir la población en grupos, se seleccionan por sistemático o aleatorio simple ya que se busca la selección aleatoria de variables que han permitido dividir los elementos. Cuando se seleccionan, hay 2 opciones:
- El unietápico: Forman parte de la muestra los integrantes del conglomerado.
- Bietápico: Es como el muestreo unietápico, solo que al realizar el muestreo de las provincias en este caso, extraes los elementos de cada una hasta completar el tamaño de la muestra.
Tipos de Muestreo No Probabilístico
Por Conveniencia: Se parte de criterio aleatorio, y al elaborar los criterios de selección, se usa información relativa a por ejemplo el volumen de personas que pasan en la zona investigada. En función de franjas horarias, de días…)
Bola de Nieve: Se pretende llegar a un público muy específico difícil de encontrar en un marco de muestreo. Se inicia un primer contacto con una persona, dándole un cuestionario, y pidiéndole que identifique a otra persona con sus mismas características para dar otro cuestionario. Es decir, la primera persona pone en contacto al investigador con otra y así sucesivamente, de ahí el nombre. Problema=escasa representatividad que puede tener la muestra final ya que las personas están vinculadas por lazos sociales y podrían tener características ocultas que resulten en resultados difíciles de extrapolar.
Según Criterio: Estudios, experiencias y datos previos permitirán al investigador seleccionar personas que compartan una característica. Es una versión del muestreo por conveniencia solo que los indicadores permiten afirmar que las personas elegidas son representantes de la población. No se puede estimar el error estadística aunque siguen siendo útiles para estudios relacionados con prueba de productos por ej. Un producto cuyo target es jóvenes con rentas altas: el investigador podría acudir a universidades privadas.
Por Cuotas: Puede ser probabilístico o no, pero cuando no forma parte de los criterios que se establecen en estudios polietápicos sería no probabilístico. El investigador define características que deben cumplirse al seleccionar entrevistados hasta cumplir un número determinado.
Aproximación al Análisis Cualitativo
Objetivos de la Codificación: Seleccionar información, organizarla e interpretar datos.
Visualización del Análisis Cualitativo
Cómo ordenar la información para realizar un mejor análisis:
- Establecer una hoja de cálculo donde se dividirán las categorías de temas recurrentes en la investigación y los grupos de personas investigadas y anotar las similitudes entre los distintos grupos. De esta forma, se llega a un análisis transversal que incluya lo dicho por cada grupo con relación a cada categoría.
- Establecer tabla cualitativa: Junto a la hoja de cálculo, se puede diseñar una tabla cruzada cualitativa que cuantifique el número de veces que se hacen aseveraciones sobre información concreta de cada categoría. Es decir, si en una categoría, se repiten varias etiquetas, se crea la tabla para estudiar su ocurrencia.
Aproximación al Análisis de Datos Cuantitativos
Codificación: Se realiza desde el diseño del cuestionario donde se asignan números para identificar las respuestas.
Valores Perdidos: Aquellos valores de una variable que son desconocidos ya que las personas que han respondido, han dado respuestas ambiguas, no consistentes o incorrectas. (ej: no sabe, no contesta) el código 9 suele asociarse a estos valores y se suelen examinar los valores extremos de cada variable para solicitar al software que destaque los rangos y los max y min de cada pregunta para ver si hay inconsistencias. Para tratar los valores perdidos, hay 2 opciones: sustituir el valor perdido por uno neutral (ej: del 1 al 10 pones 5) y así evitas que no haya sesgos o directamente eliminar el registro.
Análisis Bivariable
Cuando 1 respuesta no es suficiente, el investigador responde a preguntas que implican relacionar 2 variables.
- Coeficiente de Correlación Lineal: Se usa cuando las 2 variables son métricas y se quiere cuantificar si hay relación. Se mide el grado y la dirección de la relación entre las variables pero no es posible saber que variable influye a la otra por lo que será el investigador que lo decida.
- Contraste Chi-Cuadrado: Considera el que exista dependencia entre variables nominales. Mide las diferencias entre las frecuencias obtenidas y las esperadas. Si la diferencia es grande, sí existe relación entre variables.
- Análisis de la Varianza: Suele usarse cuando hay una variable cuantitativa y otra nominal y se quiere ver si hay relación significativa entre ambas. Una variable será la independiente que formará los grupos que se van a analizar (género) y se comparará con la dependiente que dará origen a la comparación y debe ser cuantitativa (ventas de un producto).
Análisis Multivariable
- Cluster: Técnica de segmentación que busca reducir el número de registros y no de variables. Se agrupan registros (suelen ser personas) para extraer perfiles con características similares respecto a unas variables formando clusters. Lo importante es determinar claramente cuáles son las variables en las que se basa el problema que hay que solucionar.
- Factorial: Intenta reducir el número de variables mediante correlaciones existentes entre ellas. Es decir, una vez se conoce qué valoran los registros, hay que buscar una relación entre estas respuestas para que variables tienen más peso y así fortalecer los factores más importantes.