Conocer los diferentes tipos de agrupamiento y sus principales características, identificando las variantes del agrupamiento jerárquico y los diversos parámetros que se pueden configurar para obtener un clusterizado más adecuado, con el fin de implementar una solución basada en alguna de las técnicas de agrupamiento.
De forma general, el agrupamiento es una herramienta muy utilizada para identificar segmentos o patrones de características en conjuntos de datos variados. En el caso de la agrupación suave, en lugar de poner cada muestra en clústeres separados, se le asigna una probabilidad de pertenencia ese grupo, por lo que, en el agrupamiento suave o difuso, cada observación puede pertenecer a uno o varios clústeres en función de una puntuación de probabilidad o verosimilitud.
Los siguientes enlaces son externos a la Universidad Tecmilenio, al acceder a ellos considera que debes apegarte a sus términos y condiciones.
Para conocer más sobre los fundamentos matemáticos para el aprendizaje automático, te recomendamos leer:
Mayo, M. (2020). Centroid Initialization Methods for k-means Clustering. Recuperado de https://www.kdnuggets.com/2020/06/centroid-initialization-k-means-clustering.html
Clasifica conjuntos de datos utilizando técnicas mejoradas de agrupamiento y el lenguaje de programación Python.
El conjunto de datos de la flor de iris (https://scikit-learn.org/stable/auto_examples/datasets/plot_iris_dataset.html) consta de tres diferentes tipos de la misma (setosa, versicolor y virginica), almacenados en un arreglo tipo numpy. Con base en esto, realiza lo siguiente:
Asegúrate de: