Actividad integradora
Competencia de la credencial:
Reconoce al Big Data y su importancia en la gestión de la información en la empresa.
Instrucciones:
Los siguientes enlaces son externos a la Universidad Tecmilenio, al acceder a ellos considera que debes apegarte a sus términos y condiciones.
Instacart es una empresa dedicada al servicio de compra y entrega en línea de comestibles, para ello cuenta con una aplicación para la realización de los pedidos. Su objetivo es facilitar el proceso de compra de despensa de sus clientes, cubriendo la demanda desde alimentos básicos, hasta los favoritos de ocasiones especiales.
La empresa ha puesto a disposición de cualquier persona un set de datos públicos de sus ventas con la finalidad de promover, entre los entusiastas de la programación y la ciencia de datos, la publicación de hallazgos que permitan mejorar su operación y habilitar una mejor experiencia de compra a sus clientes.
La propuesta del proyecto que se va a desarrollar incluirá el objetivo, entendimiento del negocio, descripción de los datos disponibles y los hallazgos de un análisis exploratorio de los datos:
- Lleva a cabo una investigación sobre la empresa Instacart en Internet.
- La información que será analizada corresponde a los pedidos de los clientes a través del tiempo. Para ello se cuenta con un dataset anónimo de alrededor de 3 millones de pedidos de aproximadamente 200,000 usuarios de la empresa.
Ingresa a cualquiera de las siguientes ligas para obtener estos datos:
- Una vez que se tengan los datos, realiza lo siguiente:
- Elabora un diccionario de datos.
- Diseña un diagrama de datos.
- Lleva a cabo un análisis descriptivo, el cual debe incluir la descripción detallada de cada uno de los archivos de datos.
- Realizado el análisis anterior, lleva a cabo el entendimiento del negocio, señalando los objetivos del proyecto y la descripción de los datos disponibles.
- Elabora una reflexión del proyecto que incluya la respuesta a las siguientes preguntas:
- ¿Qué tipos de datos se analizarán?
- ¿Qué atributos (columnas) de los datos te parecen útiles para hacer tu análisis?
- ¿Qué atributos parecen irrelevantes y pueden ser excluidos?
- ¿Hay datos suficientes (filas) para sacar conclusiones generalizables o hacer predicciones precisas?
- ¿Qué otras fuentes de datos podrías integrar?, ¿para qué te servirían?
- ¿Qué calidad tienen los datos?, ¿hay faltantes?
- Realiza un análisis exploratorio de los datos con la finalidad de entender y localizar hallazgos realizando al menos tres diferentes visualizaciones y preséntalos en un dashboard realizado en Tableau. Para realizar el dashboard toma como punto de partida, preguntas como las siguientes:
- ¿Qué productos se venden más?
- ¿Qué productos se venden por día y por hora?
Nota: puedes hacer este análisis usando alguna herramienta de visualización de datos como Tableau. Para ello, debes crear una cuenta de Tableau Public y realiza la instalación en tu computadora desde https://public.tableau.com/en-us/s/download y si requieres conocer un poco más de la herramienta, consulta https://public.tableau.com/app/resources/learn
- Incluye en tu reporte los comentarios con la explicación de tus hallazgos.
- Realiza algunos comentarios sobre el proyecto realizado, su utilidad para la empresa y para replicarlo en otra empresa, tu proceso de aprendizaje, etc, a manera de conclusiones y recomendaciones.
Criterios de evaluación:
Criterio |
- El diccionario de datos permite el entendimiento de los datos.
|
- El diagrama de datos permite visualizar las diferentes relaciones que guardan entre ellos.
|
- En el documento se señalan los objetivos del proyecto y la descripción de los datos disponibles.
|
- En el documento se señalan los objetivos del proyecto y la descripción de los datos disponibles.
|
- El dashboard en Tableau apoya la visualización del análisis.
|
- Se responden correctamente las preguntas planteadas y se demuestran los hallazgos encontrados.
|