Guía de Inferencia Estadística y Análisis de Datos
Inferencia Estadística
Es el proceso a través del cual se extraen conclusiones relativas a una población a partir de una muestra. Los métodos inferenciales proporcionan estimaciones y contrastes sobre los parámetros y otras características de la población.
Análisis Bivariante
Después de realizar el análisis de cada una de las preguntas del cuestionario, el siguiente paso en el análisis de la información consiste en el estudio conjunto de variables, dando lugar al análisis bivariante, que nos permite estudiar la asociación o dependencia entre variables.
Análisis Multivariante
Cuando se analiza la relación simultánea entre el comportamiento de dos o más variables, se habla de un análisis estadístico multivariante. Este tipo de análisis es más completo y nos permite mejorar el acercamiento a la realidad de los fenómenos sociales. Las técnicas que se incluyen en este análisis se clasifican en:
- Cuando se analizan relaciones de dependencia o de interdependencia
El Muestreo
- Población: conjunto colectivo objeto del estudio, también conocido como universo.
- Marco: elementos disponibles para el investigador a la hora de seleccionar las unidades muestrales
- Población finita: formada por un número limitado de elementos (habitantes de un pueblo)
- Población infinita: formada por un número muy elevado de elementos (Comunidad Autónoma)
- Elementos: cada persona u objeto que nos proporciona información.
- Unidades muestrales: pueden coincidir con los elementos cuando se lleva a cabo la investigación en una sola etapa, cuando hay que efectuar varias no coincide
- Alcance: es el entorno geográfico del estudio y a veces se le conoce como ámbito
- Tiempo: duración del estudio
- Dispersión: variación en las respuestas del colectivo analizado. Afecta el tamaño de la muestra.
- Estimación de la dispersión: hay que calcular la dispersión mediante un pretest o utilizar la de otro estudio similar o ponerse en la situación más desfavorable y que nos vamos a encontrar con la máxima dispersión.
- Nivel de confianza: También conocido como intervalo. Probabilidad con la que los resultados de la muestra se pueden extrapolar al resto de la población.
- Error de muestreo: el error cometido por el investigador y admitido por el mismo al extrapolar los datos de la muestra a la población.
- Parámetro: medida de la población
Tipos de Muestreo
Probabilístico:
Todos los elementos tienen la misma probabilidad de ser escogidos.
- Simple o aleatorio simple:
- Se enumera el censo del universo objeto de estudio.
- Mediante sorteo o con una tabla de números aleatorios se seleccionan las unidades muestrales.
- Resulta indicado para colectivos reducidos y homogéneos en relación con los aspectos que se quieran estudiar
- Sistemático:
- Numerar el censo.
- Se calcula el coeficiente de elevación.
- Se toma por sorteo un número inferior al obtenido y se empieza a contar.
- Estratificado: se utiliza para poblaciones heterogéneas respecto a lo que se quiera investigar o analizar
- Simple: se hacen tres censos, se divide el tamaño de la muestra entre el número de segmentos o estratos, se seleccionan por sorteo.
- Proporcional: se divide.
- Óptimo: sería aquel además de tener en cuenta el peso de cada uno de ellos.
- Polietápico: nos permite acceder a poblaciones más numerosas y dispersas que el muestreo por conglomerado, lo seleccionamos dentro de otro conglomerado. Pasos:
- Censamos las distintas zonas geográficas.
- Se selecciona aleatoriamente una zona geográfica.
- Dentro de ella se censan las distintas localidades.
- Se selecciona una localidad.
- Dentro de ella se censan las distintas calles.
- Se seleccionan aleatoriamente una calle con la finalidad, como en el muestreo por conglomerados, de entrevistar a las familias de esa calle.
- Se repite tantas veces como sea necesario hasta alcanzar la totalidad de la muestra.
- Conglomerados: construimos grupos en el marco muestral, de forma que cada grupo sea anteriormente tan heterogéneo como la población que estudiamos, y los conglomerados entre sí sean lo más homogéneos posible. Buscamos conglomerados similares y que cada uno represente a la población en sus diferencias.
- Random route: (rutas aleatorias) la ruta te la dan.
No Probabilístico:
Los sujetos los elige el investigador y con criterios de objetividad y racionalidad:
- De conveniencia.
- Bola de nieve o en cadena: se emplea en colectivos pequeños y especializados. Una vez localizado el elemento y efectuado el estudio se le puede solicitar que dé información de otra persona (elemento) con las mismas características y así en forma sucesiva hasta completar la muestra.
- Discrecional.
- Por juicios.
- Por cuotas.
Estadística: Conceptos
- Medición: Proceso de atribuir números a las características (propiedad o cualidad de un individuo)
- Variable: cualquier magnitud cuya medida pueda cambiar de valor. Tipos:
- Cuantitativas: puede ser medida.
- Continua: el valor de la variable puede ser cualquiera dentro de un intervalo de números reales (estatura, peso).
- Discreta: cuando el valor de la variable está limitada a ciertos números dentro de un intervalo.
- Cualitativas: cuando la medida no es numérica pueden ser contados (sexo)
- Dicotómica: cuando el valor de la variable está limitada a ciertos números dentro de un intervalo.
- Cuantitativas: puede ser medida.
- Frecuencia absoluta: es el número de veces que se repite un determinado número dentro de un suceso.
- Frecuencia relativa: el resultado o cociente que se obtiene de dividir la frecuencia de cada uno de los sucesos o datos, entre el número total de elementos observados.
- Marca de clase: punto medio de intervalo.
- Medidas de posición y centralización: se utilizan al realizar una investigación y queremos conocer, después de ordenar y tabular, alrededor de qué valores se agrupan los datos.
- Mediana: es útil conocerla, es un valor centralizado.
- Moda: es el valor que más veces se repite (unimodas, bimodales y sin moda)
Tipos de Escalas
- No métricas:
- Nominales: nos permite asignar a los individuos entrevistados a una de las diferentes categorías de respuesta. Son las escalas más sencillas y habituales dentro de un cuestionario.
- Ordinales: Permite establecer un orden en las preferencias de los individuos.
- Métricas:
- De intervalo: son escalas numéricas en las que el investigador establece a priori un rango de valoraciones.
- De ratio: es una escala numérica que hace referencia a una característica real que interesa investigar.
Escalas de Actitud
Nos permiten medir el sentimiento positivo o negativo de los individuos frente a un producto o servicio.
- Escala de Likert: nos permite conocer la actitud de los individuos a partir de la generación de un conjunto de frases representativas del estímulo estudiado. Las frases deben resaltar aspectos negativos y positivos del producto/servicio y el entrevistado debe indicar el grado de acuerdo/desacuerdo con cada una de ellas en una escala de 5 posiciones: totalmente de acuerdo, de acuerdo, dudoso, en desacuerdo, totalmente en desacuerdo.
- Escala de diferencial semántico: nos permiten medir la actitud de los consumidores frente a productos/servicios (marcas concretas) siendo posible establecer comparaciones. Se define como una escala bipolar de 7 posiciones.
Normas Básicas de Redacción y Pretest
- Adaptar el lenguaje al público objetivo (no usar tecnicismos)
- Las preguntas deben ser neutrales y objetivas. Se debe huir de todas las preguntas que mediaticen la contestación o que predispongan al entrevistado.
- Se ha de establecer un orden lógico en las preguntas.
Pretest
Cuando acabamos la redacción de las preguntas es conveniente coger una pequeña muestra.
La Clasificación de un Cuestionario
Es el procedimiento que consiste en la asignación de códigos y nos permite dar un tratamiento cuantitativo al cuestionario para su posterior tabulación y consecuentemente su tratamiento estadístico.