¿Cuándo implementar o mejorar un Data Warehouse?
A menudo nos preguntamos si la inversión que hemos hecho en temas de inteligencia de negocio han sido las adecuadas y si los beneficios al negocio son los óptimos. Este artículo contiene un resumen de problemáticas, y de las mejores prácticas que existen en el mercado, con un enfoque tecnológico pero enfocado a resultados para la organización. Para conocer, ¿Cuándo implementar o mejorar un Data Warehouse?
¿Cuál es la situación en las empresas que piensan implementar un Data Warehouse?
Independientemente del grado de madurez de la empresa y las inversiones tecnológicas, la percepción de los usuarios sigue siendo la misma:
- Se han hecho las inversiones, pero la información no es correcta.
- Se tienen que mantener procesos manuales para la corrección, depuración o emisión de reportes ejecutivos.
- Los costos de licenciamiento son altos y no hemos podido democratizar el acceso a la información para la gran mayoría de los usuarios.
- Tenemos procesos complejos de información debido a la diversidad de las fuentes de información.
A continuación, te hablaremos de algunas situaciones de gestión de información que se presentan en la empresa y que la implementación o mejora de un Data Warehouse pueden resolver; así como una solución alternativa que puedes considerar antes de iniciar un proyecto de datos.
¿Cuándo implementar o mejorar un Data Warehouse?
Información incorrecta para toma de decisiones
Solución Tradicional
Se asigna a personal que corrija y realice procesos de calidad de datos e integración de información, generando archivos de Excel que después son alimentados a los sistemas de Business Intelligence o Data Warehouse.
Solución Alterna
Automatizar los procesos de integración de información y calidad de datos con procesos de ETL, haz visible los errores en los reportes, solo así vas a evidenciar el origen del error y se generarán iniciativas para corregir los datos desde los procesos de origen.
Generar reportes con sentido al negocio que auditen la calidad de los datos comparando los datos de origen con los de Excel que procesan los usuarios.
Altos costo del Data Warehouse y Analytics
Solución Tradicional
Minimizar la compra de licencias de usuarios, identificar un power user por área de negocio y dedicar personal a generar reportes por áreas de negocio.
Solución Alterna
Los costos más altos en el Data Warehouse radican en licenciamiento de las bases de datos, licenciamiento de BI y Hardware asociado al procesamiento. Migrar el Data Warehouse a la nube, pueden generar ahorros hasta de un 70%, ya que se paga por uso sin disminuir la cantidad de recursos.
Creación de modelos de autoservicio de Analytics
Solución Tradicional
Se compran licenciamientos de BI a muchos usuarios y éstos de generar sus propios reportes sin tener control de las extracciones, calidad o gobierno de la información. Esto se da mucho con tecnologías que basados en modelos de datos asociativos o de procesamiento en memoria
Solución Alterna
Crear una arquitectura de Data Warehouse en donde se controlen de una manera eficiente los procesos de ETL, calidad de datos, gestión de datos maestros y crear una capa semántica administrada para que el negocio la pueda entender los datos, con roles adecuados para crear modelos de datos como autoservicio, data as a service (DaaS).
Implementación de Analítica Predictiva
Solución Tradicional
El Data Warehouse no está preparado para hacer procesamiento en tiempo real, aceptar grandes volúmenes de información, ingesta de datos no estructurados etc, por lo que se crean proyectos en paralelo con tecnologías más eficientes.
Solución Alterna
Crear una arquitectura en la nube de procesamiento de datos (Data Lake), calidad y armonización de datos (Data Hub) que se integren en bases de datos confiables en donde se puedan alimentar tanto sistemas analíticos como transaccionales.
Estos ejemplos son una muestra de lo que acontece todos los días en las organizaciones, y estos problemas no son una deficiencia en las áreas de TI, nacen por el crecimiento que tienen las organizaciones en cuento al manejo de información. La siguiente gráfica muestra el modelo evolutivo de uso de la información de acuerdo a la DAMA.
Normalmente empresas en el sector manufactura, están en un nivel 2 o 3, las de servicios en un nivel 3, y las financieras en nivel 3 o 4; así que independientemente de la tecnología es importante desarrollar los procesos de Gobierno de Datos que permitan evolucionar el uso de la información.
Conclusión, ¿cuándo debo implementar un Data Warehouse?
Esta decisión depende de la situación de la organización y de múltiples factores como el presupuesto, personal, tiempo disponible, prioridades, entre otros. Muchas empresas pueden continuar con su operación con alguna de las soluciones que brindamos en este artículo, y muchas otras, a pesar de realizar estos ajustes aún se enfrentan a retos de calidad de la información u oportunidad en la entrega de datos a otras áreas de negocio y dirección.
Actualmente, existen modelos de Data Warehouse muy robustos en la nube, que permite tener arquitecturas flexibles, escalables y de pago por uso, que reducen el TCO (costo total de propiedad) y nos ayuda a enfocar los esfuerzos en los procesos sustantivos de la organización para poder atender nuevos requerimientos de forma más eficiente.
Tanto AWS, Google y Microsoft tienen modelos muy interesantes para Data Warehouse, que vale la pena explorar. Microsoft Azure es una de las soluciones líderes del mercado por la adopción, el costo de Power BI (alrededor de $190 pesos por usuario al mes) y contar con una solución end-to end para la Gestión de Datos y Analytics.