Conocer y comprender el concepto de agrupamiento por k-medias con el propósito de implementarlo a un problema real y comprobar su efectividad.
La agrupación en clústeres es uno de los métodos más antiguos en el repertorio de aprendizaje no supervisado, por lo que existen numerosos tipos de este algoritmo en la literatura. En esta experiencia educativa aprenderás una de sus formas más simples, pero bastante efectiva, a la cual se le conoce como agrupación (clustering) en k-medias, en donde la variable K denota el número de conglomerados y el usuario determina el valor de dicha variable antes de comenzar a aplicar el algoritmo.
Los siguientes enlaces son externos a la Universidad Tecmilenio, al acceder a ellos considera que debes apegarte a sus términos y condiciones.
Para conocer más sobre los fundamentos matemáticos para el aprendizaje automático, revisa el siguiente video:
Rocio Chavez Ciencia de Datos. (2020, 30 de abril). Clustering con K-Means. Explicación Matemática y Mucho más… [Archivo de video]. Recuperado de https://youtu.be/n98fnSEoRiM
Clasifica conjuntos de datos utilizando la técnica de agrupamiento k-means en el lenguaje de programación Python.
El conjunto de datos de la flor de iris (https://scikit-learn.org/stable/auto_examples/datasets/plot_iris_dataset.html) consta de tres diferentes tipos de la misma (setosa, versicolor y virginica), almacenados en un arreglo tipo numpy. Con base en esto, realiza lo siguiente:
Asegúrate de: