Contenido

Objetivo

Identificar cuáles son los modelos de clasificación de predicción y su uso dentro de las finanzas.

Descripción

En esta experiencia educativa, el aprendedor será capaz de identificar las características de los modelos de clasificación, su aplicación en el ámbito financiero y su uso en la construcción de modelos.

Explicación

Haz clic para revisar la explicación.

Modelos de predicción con clasificación

Recursos adicionales

Los siguientes enlaces son externos a la Universidad Tecmilenio, al acceder a ellos considera que debes apegarte a sus términos y condiciones.

Revisa el siguiente video:

Para conocer más sobre modelos de predicción con clasificación, revisa el siguiente video:

MIT OpenCourseWare. (2017, 17 de agosto). 21. Generalized Linear Models [Archivo de video]. Recuperado de https://www.youtube.com/watch?v=X-ix97pw0xY

Revisa las siguientes lecturas:

Para conocer más sobre modelos de predicción con clasificación, revisa las siguientes lecturas:

 

Actividad

Objetivo

Comprender la forma en la que se construye un modelo de predicción por clasificación.

Instrucciones

Los siguientes enlaces son externos a la Universidad Tecmilenio, al acceder a ellos considera que debes apegarte a sus términos y condiciones.

Resuelve el siguiente análisis considerando la información disponible en la siguiente liga: https://gist.github.com/RHDZMOTA/406bb08e1a33469eceb66e5d6bf78e27/

La descarga de la información se realiza programáticamente con Python utilizando el siguiente código:

import os
import pandas as pd
url _base = (
        “https://gist.github.com/RHDZMOTA/”
        “406bb08e1a33469eceb66e5d6bf78e27/raw/a5f5d03c731df8a08e0574b150fe877f0abcc564/”
)
dataset_names = [
     “annual – income – category – low.json”,
     “annual – income – category -medium.json”,
     “annual – income – category – hight.json”,
]
dataset = pd.contact ( [pd.read_json(f”{url_base}/{name}”). T for name in dataset_names]) \
.sample(frac=1 , random_state=888). reset_index (drop=true)
  
print(dataset.shape)
dataset.head()
(222416, 6)

 

  1. Realiza un análisis exploratorio de los datos sobre el conjunto de datos completo.
  2. Particiona el conjunto de datos en subconjuntos de entrenamiento (70 % train) y prueba (30 % test) y contesta:
    1. ¿Por qué es importante dividir los datos en estos dos conjuntos? Justifica con una investigación propia.
Checklist
  • Se realiza la descarga de la base de datos.
  • Se genera un análisis exploratorio de los datos.
  • Se particiona el conjunto de datos en subconjuntos de entrenamiento y prueba.
  • Se analiza la importancia de la partición de datos.