Contenido

Objetivo

Considerar la utilidad de los proyectos de machine learning dentro de la toma de decisiones, así como la estrategia de selección del más adecuado.

Descripción

A través de esta experiencia educativa, el aprendedor podrá diseñar proyectos de machine learning para una toma de decisiones efectiva. Así mismo, conocerá las estrategias que pueden seguirse para seleccionar la más adecuada para determinada situación.

Explicación

Recursos adicionales

Los siguientes enlaces son externos a la Universidad Tecmilenio, al acceder a ellos considera que debes apegarte a sus términos y condiciones.

Revisa el siguiente video:

Para conocer más sobre diseño del proyecto de machine learning y estrategia de selección de modelos, revisa el siguiente video:

KIE. (2021, 7 de junio). Shapley Additive Explanations (SHAP) [Archivo de video]. Recuperado de  https://www.youtube.com/watch?v=VB9uV-x0gtg

Revisa las siguientes lecturas:

Para conocer más sobre diseño del proyecto de machine learning y estrategia de selección de modelos, te recomendamos leer:

Actividad

Objetivo

Analizar la importancia de la construcción de modelos de predicción en las finanzas.

Instrucciones

Los siguientes enlaces son externos a la Universidad Tecmilenio, al acceder a ellos considera que debes apegarte a sus términos y condiciones.

Para la resolución de este problema es necesario utilizar el conjunto de datos disponible en este repositorio en la nube (https://gist.github.com/RHDZMOTA/f6c5b6429fc0b51fda2deae2218d04b8/)

Realiza lo siguiente:

  1. Lee la sección de abstract de la publicación, Financial ratios and corporate governance indicators in bankruptcy prediction: a comprehensive study (https://www.sciencedirect.com/science/article/abs/pii/S0377221716000412)
  2. Utiliza esta información y complementa con investigaciones propias para generar una introducción explicando el contexto de este problema. Considera las siguientes preguntas:
    1. ¿Por qué es importante desarrollar modelos de predicción de bancarrota para las instituciones financieras?
    2. ¿Cuáles son las variables independientes que se suelen utilizar en estos modelos?
    3. ¿Cuál es el criterio de selección y métricas recomendadas para evaluar el modelo?
  3. Realiza un análisis exploratorio de los datos sobre el conjunto de datos completo.
  4. Particiona el conjunto de datos en subconjuntos de entrenamiento (80 % train) y prueba (20 % test).
    1. ¿Por qué es importante dividir los datos en estos dos conjuntos? Justifica con investigación propia.

La descarga de la información se puede hacer programáticamente con Python:

import json
import pandas as pd
import request
url _base = (
        “https://gist.github.com/RHDZMOTA/”
     “f6c5b6429fc0b51fda2deae2218d04b8/raw/”
     “b4fla7a75396e2dfcaeef1506f7418a061e5531/”
    “company – bankruptcy – records. Json”
)
dataset = pd.Dataframe([json.loads (row) for row in requests.get (url).text.splitlines()])
print(dataset.shape)
dataset
(1000,96)

Checklist
  • Se explica la importancia de construir modelos de predicción de bancarrota en las finanzas.
  • Se establece las variables independientes a utilizar en estos modelos.
  • Se detalla los criterios de selección y métricas para evaluar el modelo.
  • Se realiza el análisis exploratorio de los datos y genera la división de los mismos.