Competencia de la credencial:

Diseña interfaces de visualización de la información a través de distintos sistemas, para una toma de decisiones basada en los datos recolectados.

Instrucciones:

Lee con atención plena el siguiente caso:

Instacart, es una empresa dedicada al servicio de compra y entrega en línea de comestibles, para ello cuenta con una aplicación para la realización de los pedidos. Su objetivo es facilitar el proceso de compra de despensa de sus clientes, cubriendo la demanda desde alimentos básicos, hasta los favoritos de ocasiones especiales.
La empresa ha puesto a disposición de cualquier persona un set de datos públicos de sus ventas con la finalidad de promover, entre los entusiastas de la programación y la ciencia de datos, la publicación de hallazgos que permitan mejorar su operación y habilitar una mejor experiencia de compra a sus clientes.
Elizabeth, quien recientemente ha terminado sus estudios universitarios, trabaja en una startup dedicada al sector del estudio de los datos. Junto con otras compañeras de la empresa, han decidido trabajar con los datos de Instacart en un proyecto, que tiene como objetivo principal hacer una segmentación de sus clientes e identificar los productos más vendidos en un segmento determinado. Para ello, deben seleccionar uno de los segmentos de clientes y hacer un análisis de canasta de mercado para determinar qué productos se compran frecuentemente en conjunto en un determinado segmento. Como resultado, esperan hacer una presentación con los hallazgos y una propuesta de cómo usar la información para que la empresa mejore su operación.
La propuesta del proyecto que van a desarrollar incluirá el objetivo, entendimiento del negocio, descripción de los datos disponibles y los hallazgos de un análisis exploratorio de los datos.
Imagina que tomarás el rol de Elizabeth y realiza cada una de las indicaciones, toma en cuenta que tu actividad la entregarás en tres partes diferentes (avances):

Avance 1

  1. Prepara el ambiente de Python en el equipo de cómputo donde se realizará la evidencia, para ello instala Anaconda mediante los siguientes pasos:
  1. Lleva a cabo una investigación sobre la empresaInstacart en Internet.
  2. La información que será analizada corresponde a los pedidos de los clientes a través del tiempo. Para ello se cuenta con un dataset anónimo de alrededor de 3 millones de pedidos de aproximadamente 200,000 usuarios de la empresa.

  3. Ingresa a cualquiera de las siguientes ligas para obtener estos datos:


    Para obtener más información de este dataset, consulta el siguiente recurso:
    Stanley, J. (2017). 3 Million Instacart Orders, Open Sourced. Recuperado de https://tech.instacart.com/3-million-instacart-orders-open-sourced-d40d29ead6f2

  1. Una vez que se tengan los datos, realiza lo siguiente:
  1. Realizado el análisis anterior, lleva a cabo el entendimiento del negocio, señalando los objetivos del proyecto y la descripción de los datos disponibles.

Criterios de evaluación:

  1. Incluye el entendimiento del negocio, además de determinar los objetivos del proyecto.
  2. Crea un diccionario de datos.
  3. Incluye un diagrama de datos.
  4. Realiza un análisis descriptivo con la descripción de cada uno de los archivos.