Analítica de Datos: Descriptiva, Predictiva y Prescriptiva
Analítica Descriptiva
Definición
Describe lo que ha sucedido. Resume y describe datos históricos a través de estadísticas y visualizaciones.
El dashboard, un panel de control, muestra datos clave y métricas importantes para monitorear desempeño, identificar tendencias y tomar decisiones informadas.
Ejemplo
El análisis de ventas en una cadena de tiendas minoristas. Utilizando la analítica descriptiva, la empresa genera informes y visualizaciones que detallan las ventas por categoría de producto, ubicación y período. Las bases de datos requeridas incluyen datos de transacciones (fecha, producto, cantidad, precio), inventario (stock, reposiciones), demográficos de clientes (edad, género, ubicación) y datos de promociones. Este análisis permite identificar productos más vendidos, períodos pico y la efectividad de las promociones, facilitando decisiones sobre inventario, marketing y demanda.
Analítica Predictiva
Definición
Une datos históricos, modelos estadísticos y algoritmos para predecir eventos futuros. Utiliza datos históricos y actuales, algoritmos de machine learning y modelos estadísticos para predecir resultados y tendencias. Identifica patrones para hacer predicciones sobre eventos futuros.
Ejemplo
La predicción de la rotación de clientes (churn prediction) en una empresa de telecomunicaciones. Se identifica qué clientes tienen mayor probabilidad de cancelar sus servicios. Se requieren bases de datos como historial de uso (llamadas, mensajes, datos), datos demográficos, registros de interacciones con el servicio al cliente y datos de facturación. Se identifican patrones y señales tempranas de deserción, permitiendo implementar estrategias de retención.
Machine Learning
El machine learning, o aprendizaje automático, es una rama de la inteligencia artificial que desarrolla algoritmos para que las computadoras aprendan de la experiencia sin ser programadas para tareas específicas. Analiza datos para encontrar relaciones, ajustando sus algoritmos para mejorar su rendimiento.
Tipos y tareas del Machine Learning
Aprendizaje Supervisado
Entrena un modelo con datos etiquetados. El modelo aprende a hacer predicciones o clasificaciones basadas en ejemplos etiquetados.
- Regresión: Modela la relación entre variables de entrada y una variable de salida continua. Predice valores numéricos.
- Clasificación: Predice la pertenencia de una observación a una categoría. La variable de salida es discreta.
Aprendizaje no supervisado
Entrena modelos con datos no etiquetados. El modelo encuentra patrones por sí mismo.
- Clustering: Agrupa datos en clusters, donde las observaciones dentro de un grupo son más similares entre sí que con las de otros grupos.
Aprendizaje Supervisado
- Datos: Recopilar y preparar datos.
- Definir Problema: Definir el objetivo.
- Definir Modelo: Seleccionar el modelo (regresión logística o árbol de clasificación).
- Entrenar Modelo: Estimar parámetros con datos históricos.
- Hacer Predicciones: Usar el modelo para predecir.
- Evaluar Resultados: Evaluar precisión y efectividad.
Métricas de evaluación
- Precisión = VP / (VP+FP): Proporción de verdaderos positivos sobre los predichos como positivos.
- Recall = VP / (VP+FN): Proporción de verdaderos positivos sobre todos los casos positivos.
- Accuracy = (VP+VN) / (VP+VN+FP+FN): Proporción de predicciones correctas sobre el total.
- Cross-Validation: Divide datos en entrenamiento y testeo para una evaluación independiente.
- K-fold Cross-Validation: Divide datos en k partes y repite la validación k veces para una evaluación robusta.
Analítica Prescriptiva
Definición
Usa datos para generar recomendaciones en la toma de decisiones. Utiliza modelos y técnicas de optimización para sugerir las mejores decisiones, considerando restricciones y objetivos.
Ejemplo
Optimización de precios en una cadena de hoteles. Ajusta precios según demanda, competencia, eventos, etc. Las bases de datos incluyen reservas (fecha, tarifa, duración), demanda (ocupación, estacionalidad), competencia (precios) y datos externos (eventos). Recomienda precios óptimos para maximizar ocupación e ingresos.