Módulo 1 / Semana 4
En México, el proceso de admisión a las mejores universidades suele representar un gran reto para la población de alumnos aspirantes de nivel preparatoria. En muchos casos, los estudiantes suelen entrenarse mediante cursos intensivos y privados. En esta actividad, como experto en aprendizaje automático, deberás analizar un conjunto de datos que te permitirá predecir comportamientos y tendencias en el desempeño de los alumnos en este tipo de exámenes.
Aplicar conocimientos matemáticos y la teoría de probabilidad, así como las bases del aprendizaje automático mediante el lenguaje Python.
Los alumnos de preparatoria suelen prepararse y esforzarse con meses de anticipación para realizar su examen de admisión a la universidad. Según las estadísticas, el 30% de alumnos que no viven en la capital consigue acreditar su examen, mientras que solo el 10% del 70% de alumnos locales o citadinos (que también acreditan el examen) tienen padres que no estudiaron la universidad.
Un grupo de investigadores del sector educativo está preocupado por incrementar las posibilidades de que los alumnos de preparatoria acrediten su examen de admisión a la universidad, por lo que, con apoyo de un grupo independiente estadounidense, han obtenido un conjunto de datos (dataset) en formato CSV (https://www.kaggle.com/code/spscientist/student-performance-in-exams ) en donde se consideran diferentes aspectos para medir el desempeño de los alumnos en su examen (test) en tres diferentes categorías: matemáticas, lectura y escritura. Dentro de los aspectos a considerar se encuentran factores como la influencia de los antecedentes académicos de los padres, la preparación para el examen, entre otros.
Criterios de evaluación |
Ponderación |
Crea un notebook usando Google Colab y realiza el programa en Python que calcula la probabilidad indicada en el segundo punto. |
20 |
Emplea el notebook del punto 2 e importa el dataset. |
10 |
Construye el histograma referente a los datos a tratar. |
20 |
Evalúa si la gráfica obtenida tiene semejanzas con la distribución normal y calcula la media, la mediana y la desviación estándar de los datos. |
20 |
Dibuja la gráfica de la distribución gaussiana de los datos. |
20 |
Responde las preguntas planteadas. |
10 |
Total |
100 |