López y Zarza (2017) describieron que el requerimiento más claro para llevar a cabo una mejor toma de decisiones es que existan los datos, es decir, que cada transacción, operación, decisión o consecuencia genere algún tipo de efecto identificable en el tiempo, de modo que pueda archivarse para futuras referencias.
Por tanto, el dato vivo es el dato que se consume de manera recurrente. En este aspecto, la infraestructura que soporte la generación, ingesta, almacenamiento y consumo de los datos será crítica para la organización.
El dato debe buscarse antes de tomar una decisión, y solo tienen sentido aquellos datos que la posibilitan. El término relevante, entonces, es la decisión en relación con los datos.
El siguiente elemento en la toma de decisiones es la evaluación de las consecuencias o resultados de las decisiones tomadas. El impacto de las decisiones se da en tres variables:
En este tema comprenderás el concepto de big data, cómo se conforma y la importancia de su uso en la toma de decisiones.
De inicio, sabes que los datos generan información, conocimiento y más datos. Un entendimiento tradicional de la relación entre estas tres entidades se puede presentar de la siguiente manera:
Figura 1. Núcleos tradicionales, desde los datos al conocimiento.
Sin embargo, en el big data, la generación del conocimiento no es tan lineal, sino que el análisis de datos permite tener una imagen clara del pasado y del presente para reconocer tendencias y cambios verdaderos, significa evaluar y explorar los propios criterios para exponer los sesgos (López y Zarza, 2017). Gráficamente se vería como en la figura 1.
El conocimiento en un sistema, por lo tanto, es la información en otro y tal vez el dato en un tercer sistema como muestra la figura 2.
Figura 2. Sistema retroalimentado.
Fuente: López, J., y Zarza, G. (2017). LA INGENIERÍA DEL BIG DATA: CÓMO TRABAJAR CON DATOS. España: Editorial UOC.
Teniendo como base lo anterior, se puede comenzar a distinguir qué significa en la práctica ser big data o data driven.
Cabría entonces preguntarse: ¿Entiendes los reportes que utilizas? ¿Comprendes la variabilidad de los datos, los rangos de incertidumbre o lo confiable que es la fuente? ¿Puedes imaginar más de una posible explicación a los datos que lees? ¿Tomas decisiones y asumes riesgos controlados? ¿O tan solo buscas tener información para cubrir las decisiones que ya habías considerado?
La creación del conocimiento mediante el big data no tiene ninguna utilidad cuando este no se comparte con los involucrados en la toma de decisiones. Por lo tanto, debe verse como un proceso que amplifica lo generado por las personas en lo individual y se cristaliza como parte del conocimiento de la empresa.
El manejo apropiado de los datos deriva en una ventaja competitiva para la organización por la cantidad de interacciones con los clientes, las transacciones por medio de los dispositivos y los distintos canales de distribución.
Figura 3. Creación del conocimiento a través del big data.
Fuente: López, J., y Zarza, G. (2017). LA INGENIERÍA DEL BIG DATA: CÓMO TRABAJAR CON DATOS. España: Editorial UOC.
1.1 ¿Qué es el big data?
Para explicar lo que significa big data, primero hay que señalar lo que no es, esto para que puedas dimensionar el concepto en tu situación personal.
Figura 4. Qué no es el big data.
Fuente: Facultad de Administración y Ciencias Sociales - Universidad ORT Uruguay. (2018, 17 de julio). Analítica de datos aplicada a negocios: ¿Es para mí? ¿Es ahora? [Archivo de video]. Recuperado de https://www.youtube.com/watch?v=n7bwIqyhPa8
El big data se considera como tal a partir del cumplimiento de las siguientes características:
Figura 5. Condicionantes del big data.
Fuente: Facultad de Administración y Ciencias Sociales - Universidad ORT Uruguay. (2018, 17 de julio). Analítica de datos aplicada a negocios: ¿Es para mí? ¿Es ahora? [Archivo de video]. Recuperado de https://www.youtube.com/watch?v=n7bwIqyhPa8
De acuerdo con Ladredo (2020), las tres V del big data significan lo siguiente:
Esto significa que las organizaciones llegan a un punto en el que las hojas de cálculo y las formas tradicionales de gestionar les es insuficiente para la toma de decisiones, por lo que el siguiente paso es transitar hacia nuevas formas de administrar los recursos: el big data.
La literatura especializada describe que un exabyte alcanza para registrar todas las palabras pronunciadas por todos los seres humanos que hayan existido. La mayor parte de la catarata de datos se crea porque sí de forma espontánea.
Cada vez que haces algo que involucra una transacción, registro o un dispositivo electrónico, se puede saber el tipo de personalidad, mapas detallados de cerebros de acuerdo con las neuronas conectadas, planos de comportamiento criminal, manejo de crisis y catástrofes naturales, entre otras cosas, y esto solamente cuando las personas comparten opiniones en las redes sociales (Sosa, 2019).
La figura 6 es clara para describir algunos otros usos que se le da al big data.
Figura 6. Usos del big data.
Fuente: Facultad de Administración y Ciencias Sociales - Universidad ORT Uruguay. (2018, 17 de julio). Analítica de datos aplicada a negocios: ¿Es para mí? ¿Es ahora? [Archivo de video]. Recuperado de https://www.youtube.com/watch?v=n7bwIqyhPa8
¿Qué hacer entonces?
Comprender el proceso.
Hay que recordar que el big data es una nueva disciplina que aún está en vías de desarrollo y que en las organizaciones falta personal especializado para su manejo, ya que no se ha dado el salto del Small Data a nuevos modelos de análisis de datos.
La siguiente figura muestra la secuencia que te permitirá visualizar la totalidad del proceso para que puedas decidir más acertadamente mediante el análisis.
Figura 7. Los cuatro pilares del análisis de datos.
Fuente: Comunicación Numérica. (2020, 7 de septiembre). Fundamentos del Análisis de Datos para Toma de Decisiones [Archivo de video]. Recuperado de https://www.youtube.com/watch?v=qvZxvMWMvDo&t=1s
Hay que ir por partes.
El inicio, como puedes observar en la figura 8, es hacerte de tres elementos importantes para analizar tus insumos informativos, los cuales son los siguientes:
La estrategia se centra en definir las preguntas que el análisis deberá responder.
Por ejemplo: ¿Cómo han evolucionado los ingresos en el último año?, ¿qué relación existe entre la rentabilidad y la cantidad de ingresos por categoría? Una vez definidas las preguntas, el siguiente paso es construir los conjuntos de datos que te permitirán contestarlas.
Figura 8. Elementos para el análisis de datos.
Fuente: López, J., y Zarza, G. (2017). LA INGENIERÍA DEL BIG DATA: CÓMO TRABAJAR CON DATOS. España: Editorial UOC
Este proceso puede ser muy sencillo si los datos se encuentran ya disponibles de manera estructurada. Pero si no es el caso, la preparación de los datos puede suponer hasta el 80% del tiempo de un proyecto de analítica. Es importante, por lo tanto, que los datos cuenten con:
El proceso de diseño consta de tres fases:
1.2 Definición de bases de datos para analítica
HEAVY.AI (s.f.) describe que una base de datos analítica almacena y administra big data, incluidos datos comerciales, de mercado y de clientes para el análisis de inteligencia comercial.
Las bases de datos analíticas están optimizadas para proporcionar tiempos de respuesta de consulta rápidos y análisis avanzados. Sus características incluyen almacenamiento basado en columnas, carga en memoria de datos comprimidos y la capacidad de buscar datos a través de múltiples atributos.
Los modelos de big data se consideran buenos cuando te hacen ganar tiempo en la obtención de información.
De acuerdo con López (2021), la programación tradicional (modelos relacionales) hace que se consideren soluciones tecnológicas muy sobredimensionadas. Algunas organizaciones de tecnologías ofrecen soluciones excelentes para proyectos de big data con una memoria de dos terabytes de almacenamiento.
Estos tipos de soluciones pueden procesar hasta 500 millones de registros en un lapso de dos a tres minutos, que es un muy buen tiempo de procesamiento, además de que la herramienta es muy fácil de manejar.
Figura 9. Características de un buen modelo de big data.
Fuente: Facultad de Administración y Ciencias Sociales - Universidad ORT Uruguay. (2018, 17 de julio). Analítica de datos aplicada a negocios: ¿Es para mí? ¿Es ahora? [Archivo de video]. Recuperado de https://www.youtube.com/watch?v=n7bwIqyhPa8
En el siguiente esquema puedes observar que la información se alimenta de distintas fuentes (Holistics, 2020).
Figura 10. Configuración común para una base de datos analítica.
Fuente: Holistics. (2020). The Analytics Setup Guidebook. Recuperado de https://www.holistics.io/books/setup-analytics/a-modern-analytics-stack/
Como puedes observar, las fuentes de las que se alimenta la base de datos pueden ser de distinta naturaleza, tales como:
1.3 Distintos tipos de análisis
Dependiendo de tus propias necesidades sobre lo que deseas hacer, puedes obtener información de tipo:
Figura 11. Análisis de datos- Valor agregado.
Fuente: Facultad de Administración y Ciencias Sociales - Universidad ORT Uruguay. (2018, 17 de julio). Analítica de datos aplicada a negocios: ¿Es para mí? ¿Es ahora? [Archivo de video]. Recuperado de https://www.youtube.com/watch?v=n7bwIqyhPa8
Principalmente, las visualizaciones de datos permiten conseguir tres objetivos:
Figura 12. Objetivos del análisis visual.
Figura 13. El iceberg de la analítica de datos.
Fuente: López, J., y Zarza, G. (2017). LA INGENIERÍA DEL BIG DATA: CÓMO TRABAJAR CON DATOS. España: Editorial UOC.
Como puedes observar en la figura 13, el big data es un iceberg lleno de oportunidades que se encuentra en un mar de datos muy extenso y peligroso, pues muchas empresas solo se enfocan en la punta del iceberg.
Para muchas personas, el big data es solo una nueva tecnología que usa datos masivos, sobre todo de las redes sociales, para tomar decisiones sobre sus estrategias de ventas y publicidad. Sin embargo, es mucho más que eso, dado que engloba distintas ciencias, como la estadística y el machine learning, para diferentes propósitos en finanzas, industria, medicina, recursos humanos. Por ello, si no se tiene cuidado con el resguardo de los datos, su análisis puede generar grandes dolores de cabeza.
1.4 Herramientas para hacer análisis de datos
Figura 14. Herramientas para la analítica de datos.
Fuente: López, J., y Zarza, G. (2017). LA INGENIERÍA DEL BIG DATA: CÓMO TRABAJAR CON DATOS. España: Editorial UOC.
1.5 Tipos de bases de datos analíticas en el mercado
Según Indicative (2022), las características de las bases de datos analíticas incluyen almacenamiento basado en columnas, carga en memoria de datos comprimidos y la capacidad de buscar datos a través de múltiples atributos.
A continuación, se describen algunas de las principales bases de datos analíticas en el mercado:
Revisando cada uno de los tipos de bases de datos, puedes elegir, de acuerdo con el proyecto, presupuesto, empresa y datos que se tengan, el que puede brindar la solución para el momento actual e ir viendo a cuál ir evolucionando con el paso del tiempo. Los ejemplos de cada una de estas tecnologías dan una idea de cómo el mercado se va abriendo a estas posibilidades y nuevas opciones.
puedes ver, se tiene una variedad de opciones en cuanto a bases de datos de analítica se refiere, siendo esta elección uno de los puntos clave del Departamento de Analítica, en conjunto con la arquitectura y el gobierno de datos.
Sin lugar a duda, el aprovechamiento de los datos es la piedra angular que las diferentes industrias han buscado aprovechar durante décadas. Finalmente, gracias a la consolidación del big data y su movimiento hacia la inteligencia artificial, se está en condiciones de poder lograrlo y realmente aprovechar los datos.
Figura 15. Big data, data mining y machine learning.
Fuente: López, J., y Zarza, G. (2017). LA INGENIERÍA DEL BIG DATA: CÓMO TRABAJAR CON DATOS. España: Editorial UOC.
El gran reto de las compañías radica en poder implementar soluciones que les permitan desarrollar y aprovechar esa piedra angular dentro del marco de procesos que pueden escalar, que sean eficientes y cuya utilización y mantenimiento no genere un nuevo problema en sí mismo.
Las dimensiones de la empresa, de los datos y de lo que se quiere lograr con ellos son los indicadores que deben guiar esta decisión, teniendo en cuenta toda la tecnología de la que ya se puede echar mano, así como de las experiencias previas.
Además, cada vez son más las empresas que, al ofrecer servicios en la nube, brindan esquemas de estos tipos con la flexibilidad que se requiere y con la capacidad indicada.
Ahora que conoces estos nuevos tipos de bases de datos, te puedes hacer las siguientes preguntas: ¿Cuál pudieras aplicar a tu proyecto? ¿Por qué? ¿Qué ventajas le daría?
Los siguientes enlaces son externos a la Universidad Tecmilenio, al acceder a ellos considera que debes apegarte a sus términos y condiciones.
Videos
Para conocer más acerca de bases de datos analíticas, te sugerimos ver lo siguiente:
Lecturas
Para conocer más acerca de bases de datos analíticas, te sugerimos leer lo siguiente:
Asegúrate de:
"Tecmilenio no guarda relación alguna con las marcas mencionadas como ejemplo. Las marcas son propiedad de sus titulares conforme a la legislación aplicable, estas se utilizan con fines académicos y didácticos, por lo que no exísten fines de lucro, relación publicitaria o de patrocinio".