De las Bases de Datos a los Almacenes de Datos

Finalidades y Evolución de los Sistemas de Información

La finalidad de los Sistemas de Información es dar soporte a los procesos básicos de la organización: ventas, producción, personal, etc. Se busca satisfacer esta necesidad de un soporte para la gestión de la información.

Aspectos de la Evolución:

  • Informes Batch: Información difícil de encontrar y analizar, poco flexible.
  • Primeros DSS (Decision Support Systems): Basados en terminal, no integrados con otras herramientas.
  • Acceso a datos y herramientas de análisis integradas: Herramientas de consulta e informes, hojas de cálculo. Acceden a bases de datos operacionales.
  • Almacenes de datos y herramientas OLAP.
  • Herramientas de minería de datos y simulación.

Herramientas de Negocios que Coexisten

Diferencia entre EIS y OLAP

EIS (Executive Information System) es un sistema de información y un conjunto de herramientas asociadas:

  • Proporciona acceso a la información de estado.
  • Especializado para analizar el estado diario de la organización.
  • La información solicitada suele ser, en gran medida, numérica y representada de forma gráfica.

OLAP (Online Analytical Processing) son más genéricas:

  • Funcionan sobre un sistema de información.
  • Permiten realizar agregaciones y combinaciones de los datos de manera más compleja.

Diferencia entre Informes Avanzados y OLAP

  • Los sistemas de informes o consultas avanzadas están basados en sistemas relacionales y objeto-relacionales. Utilizan operadores clásicos.
  • El resultado se representa de manera tabular.

OLAP:

  • Basadas en sistemas de interfaces multidimensionales, utilizan operadores específicos además de los clásicos.
  • El resultado se presenta de una manera matricial o híbrida.

Diferencia entre OLAP y Minería de Datos

OLAP:

  • Proporciona facilidades para manejar y transformar los datos.
  • Producen otros datos y ayudan a analizar los datos al proporcionar diferentes vistas de ellos.

Minería de datos:

  • Permiten extraer patrones, modelos, descubrir relaciones, etc.
  • Producen reglas o patrones.

Relaciones entre estos Modelos

Estructuras de Datos para la Inteligencia de Negocios

Inteligencia de Negocios es el término que caracteriza una amplia variedad de tecnologías, plataformas de software y especificaciones de aplicaciones.

El objetivo es contribuir a la toma de decisiones, mejorando el desempeño empresarial y promover la ventaja competitiva.

Business Intelligence (BI) se caracteriza por:

  • Buscar hechos cuantitativos medibles.
  • Usar métodos y tecnologías para el análisis de hechos.
  • Desarrollar modelos que expliquen causa y efecto.
  • Experimentar con aplicaciones alternativas.
  • Supervisar resultados.

Ciclo de la Inteligencia de Negocios

  1. Análisis: Determinar los datos.
  2. Reflexión: Estudio de los hechos y la situación.
  3. Acción: Proceso de toma de decisiones.
  4. Medición: Evaluar los resultados al compararlos contra los estándares.

Desafíos de la BI

  • Complejidad técnica.
  • Escasez de aplicaciones.
  • El empleo de nuevas plataformas.
  • Falta de asesores especializados.
  • Inversión.

Metas

  • Explotar los conceptos de los sistemas basados en conocimiento.
  • Implementar almacenes de datos.
  • Integrar las disciplinas.
  • Ofrecer un modelo de solución que aproveche las tecnologías.

Almacenes de Datos, OLAP y Minería de Datos

El almacén de datos (Data Warehouse o DW) es ahora el sistema de información central. Es una colección de datos orientada a un dominio, integrada, no volátil y variable en el tiempo. Debe servir para la toma de decisiones.

Actualmente, OLAP y DW son las maneras más efectivas de integrar, transformar y combinar los datos para facilitar al usuario u otros sistemas el análisis de la información.

Minería de Datos

Es un conjunto de técnicas de análisis de datos que permiten:

  • Extraer patrones, tendencias y regularidades para describir y comprender mejor los datos.
  • Extraer patrones y tendencias para predecir comportamientos futuros.
  • Debido al gran volumen de datos, este análisis debe ser semiautomático.

Se diferencia de las demás en el sentido de que no transforma y facilita el acceso a la información para que el usuario analice más fácilmente.

La minería de datos es solo una etapa del proceso de extracción de conocimiento a partir de datos, consta de varias fases:

  • Preparación de datos, minería, evaluación, difusión y uso de modelos.

Incorpora diferentes técnicas: árboles de decisión, redes neuronales, etc.

¿Es necesario tener un almacén de datos para realizar minería de datos?

Los almacenes no son imprescindibles para hacer extracción de conocimientos a partir de datos. Se lo puede hacer sobre un simple fichero de datos.

Ventajas de organizar un almacén

  • Grandes volúmenes de datos.
  • Datos provienen de fuentes heterogéneas.
  • Se van a combinar de manera arbitraria no predefinidas.

Conclusión: Las organizaciones necesitan gestionar no solo datos, sino información y conocimiento. El objetivo final es mejorar la toma de decisiones.