Contenido

Objetivo

Comprender las bases teóricas del método de análisis de componentes principales con el objetivo de aplicarlo en programación y encontrar soluciones a los problemas de reducción de dimensión.

Descripción

La cantidad de datos que se crean cada segundo está creciendo a un ritmo exponencial, representando uno de los recursos más valiosos en la actualidad. Por lo tanto, el objetivo principal del aprendizaje no supervisado es crear representaciones compactas de los datos detectando su estructura intrínseca y realizando el análisis exploratorio de datos. Por ende, resulta necesario formular el problema de la reducción de dimensionalidad, por lo que el análisis de componentes principales (ACP en español y PCA en inglés) representa un método espectral fundamental, así como la base de técnicas de reducción de dimensionalidad no lineal.

Explicación

Haz clic para revisar la explicación.

Reducción de la dimensión

Recursos adicionales

Los siguientes enlaces son externos a la Universidad Tecmilenio, al acceder a ellos considera que debes apegarte a sus términos y condiciones.

Revisa la siguiente lectura:

Para conocer más sobre los fundamentos matemáticos para el aprendizaje automático, te recomendamos leer:

Scikit-learn.org. (s.f.). Decomposing signals in components (matrix factorization problems). Recuperado de https://scikit-learn.org/stable/modules/decomposition.html#pca

Actividad

Objetivo

Aplicar el análisis de componentes principales (ACP) para el análisis de datos utilizando el lenguaje de programación Python.

Instrucciones

Utiliza la implementación del algoritmo de análisis de los componentes principales (ACP, PCA en inglés) visto durante el tema para realizar lo siguiente:

  1. Ingresa a https://www.kaggle.com/datasets?search=pca y elige un conjunto de datos que sea distinto al de las flores de iris, pero que posea dimensionalidades o propiedades similares.
  2. Inicia un entorno de trabajo en Google Colaboratory (https://colab.research.google.com/) y crea un nuevo cuaderno en lenguaje Python.
  3. Implementa el algoritmo de análisis de los componentes principales (ACP).
  4. Evalúa el desempeño del algoritmo con el nuevo conjunto de datos.
Checklist

Asegúrate de:

  • Implementa el algoritmo de análisis de los componentes principales (ACP).
  • Evalúa el funcionamiento del algoritmo para reducir dimensiones al emplear el nuevo conjunto de datos.