Análisis Factorial Exploratorio y Confirmatorio: Guía Completa
Análisis Factorial
Introducción
El Análisis Factorial (AF) es una técnica estadística que busca reducir un conjunto de variables observadas a un número menor de variables latentes, llamadas factores, que se consideran responsables de la conducta o fenómeno estudiado. Esta técnica está estrechamente relacionada con la estructura interna y la dimensionalidad de los datos.
Tipos de Análisis Factorial
Análisis Factorial Exploratorio (AFE)
El AFE se utiliza para la búsqueda de dimensiones subyacentes en un conjunto de variables observadas, sin establecer relaciones a priori entre las variables y los factores. Se asume que la conducta está determinada por un número indeterminado de factores que pueden afectar a las variables. Los factores de error se consideran independientes.
En el AFE no se pueden realizar pruebas de hipótesis (decisiones subjetivas), lo que dificulta el tratamiento de la invarianza.
Análisis Factorial Confirmatorio (AFC)
En el AFC se establecen teorías a priori sobre los factores, las variables que los afectan y las relaciones entre los factores. Se busca confirmar o refutar un modelo predefinido.
Aplicación del Análisis Factorial Exploratorio
El AFE se basa en matrices de correlación de Pearson, lo que implica que las variables deben ser cuantitativas y tener relaciones lineales. Para ítems dicotómicos o politómicos, se puede utilizar el programa FACTOR (free).
Se recomienda un mínimo de 4-5 variables para realizar un AFE. Además, es importante que exista multicolinealidad o correlaciones elevadas (+0,30) entre las variables.
Supuestos del Modelo
- Las correlaciones entre variables y factores se deben a factores comunes.
- Algunas variables (ítems) se parecen más entre sí que otras porque existe un factor común que influye más sobre ellas que sobre las demás.
- Los factores comunes serán menos que el número de variables, por lo que el AF reduce la dimensionalidad.
Comunalidad y Unicidad
La varianza de una variable en la ecuación del modelo en puntuaciones típicas (valor = 1) se divide en dos componentes:
- Varianza Común: Varianza compartida con las otras variables del análisis (comunalidad).
- Varianza Única (Unicidad): Varianza específica de la variable.
Preparación de los Datos
La preparación de los datos implica la selección de las variables que se pretenden analizar y la depuración de errores. Se debe construir una matriz de correlación (o de covarianzas) de orden p (número de variables). Esta matriz debe ser definida positiva.
Fases del Análisis Factorial Exploratorio
1. Adecuación de la Matriz para la Factorización
- Valores KMO: Indican la adecuación muestral para el análisis factorial (0,5-0,69 mediocre / 0,7-0,79 bueno / 0,8-0,89 altos / +0,9 excelentes).
- Prueba de Esfericidad de Bartlett: Pone a prueba la hipótesis nula de que la matriz es una matriz de identidad (correlaciones entre variables son 0) y se distribuye según ji-cuadrado con grados de libertad = número de correlaciones.
2. Extracción de Factores
En esta fase se determina el número de variables latentes como combinaciones lineales de los factores. No tiene interpretaciones claras. El objetivo es reproducir con el mínimo error la matriz de pesos o saturaciones (A => matriz de pesos).
Se utiliza el procedimiento de componentes principales. Con la matriz A de pesos se determina la comunalidad (proporción de la varianza de cada variable explicada por los factores comunes).
Reproducción de la Matriz R: Se realiza por medio de factores comunes y supuestos. Ecuación matricial -> autovectores -> diagonalización de la matriz.
Autovalores: El número de autovalores es igual al número de variables = 1 (tipificadas). Representan la cantidad de variación del conjunto de variables que explica cada factor (cantidad de información que aporta). El primer autovalor explica más que el segundo (decreciente). Todos los autovalores son positivos (matriz definida positiva). Si alguno es 0, la matriz es semidefinida positiva.
Decisión sobre Factores a Extraer:
- Criterio de Kaiser: Extraer factores con autovalores mayores que 1 (no recomendado).
- Scree test (gráfico de sedimentación): Extraer un número de factores hasta donde la curva se acerca a una pendiente casi nula.
- Basados en los residuos de las correlaciones (raíz cuadrada media residual, raíz cuadrada media de las correlaciones parciales).
- Análisis paralelo (FACTOR).
- MAP (minimización de correlaciones parciales).
3. Rotación de Factores
La rotación de factores se realiza para facilitar la interpretación sustantiva (P = AT => Pasar de la matriz A a la matriz P buscando una matriz de transformaciones T). Se busca una estructura simple (valores próximos a 0).
Estructura Simple:
- Cada fila de la matriz tendrá al menos un 0 (al menos un factor que no contribuya).
- Para cada factor habrá un conjunto de variables cuyas saturaciones serán 0.
- Para cada par de columnas habrá varias variables con saturaciones 0 en una de ellas pero no en la otra.
- Si hay 4 o más factores comunes considerando pares de columnas, una buena proporción de las variables tendrán 0 en las columnas.
- Para cada par de columnas habrá solo un bajo número de variables con saturaciones distintas de 0 en ambas.
Tipos de Rotación:
- Rotación Ortogonal: Los factores son independientes y no correlacionados (Varimax, Quartimax, Equamax). Extracción por cuadrados mínimos no ponderados y rotación con varianzas con normalización Kaiser.
- Rotación Oblicua: Los factores están correlacionados (Oblimin, Quartimin, Primax). Se obtiene una matriz de configuración/patrón (P) y una matriz de correlaciones entre factores. La matriz de estructura se calcula a partir de la matriz de patrón y la matriz de correlaciones.
Tras la rotación, la comunalidad de la variable se mantiene. Sin embargo, en el caso de las rotaciones oblicuas, la comunalidad ya no es la suma de las saturaciones al cuadrado, sino que deben contemplarse las correlaciones entre factores.
La varianza explicada por cada factor sigue siendo el promedio de las saturaciones al cuadrado, pero la varianza total explicada ya no es la suma de las varianzas explicadas por cada factor (debido a los solapamientos). Cuando se realiza una rotación oblicua, no se habla de la varianza explicada por cada factor, sino de la varianza explicada por el conjunto de factores.
Se consideran saturaciones significativas aquellas superiores a 0,40.