Módulo 1 / Semana 4

Actividad 1.


En México, el proceso de admisión a las mejores universidades suele representar un gran reto para la población de alumnos aspirantes de nivel preparatoria. En muchos casos, los estudiantes suelen entrenarse mediante cursos intensivos y privados. En esta actividad, como experto en aprendizaje automático, deberás analizar un conjunto de datos que te permitirá predecir comportamientos y tendencias en el desempeño de los alumnos en este tipo de exámenes.

Aplicar conocimientos matemáticos y la teoría de probabilidad, así como las bases del aprendizaje automático mediante el lenguaje Python.

  1. Analiza la primera parte del caso:
  2. Los alumnos de preparatoria suelen prepararse y esforzarse con meses de anticipación para realizar su examen de admisión a la universidad. Según las estadísticas, el 30% de alumnos que no viven en la capital consigue acreditar su examen, mientras que solo el 10% del 70% de alumnos locales o citadinos (que también acreditan el examen) tienen padres que no estudiaron la universidad.

  3. Crea un notebook usando Google Colab y programa en lenguaje Python la probabilidad de que un alumno cuyos padres tienen estudios universitarios acredite su examen de admisión a la universidad.
  4. Revisa la segunda parte del caso:
  5. Un grupo de investigadores del sector educativo está preocupado por incrementar las posibilidades de que los alumnos de preparatoria acrediten su examen de admisión a la universidad, por lo que, con apoyo de un grupo independiente estadounidense, han obtenido un conjunto de datos (dataset) en formato CSV (https://www.kaggle.com/code/spscientist/student-performance-in-exams ) en donde se consideran diferentes aspectos para medir el desempeño de los alumnos en su examen (test) en tres diferentes categorías: matemáticas, lectura y escritura. Dentro de los aspectos a considerar se encuentran factores como la influencia de los antecedentes académicos de los padres, la preparación para el examen, entre otros.

  6. Empleando el dataset del punto anterior, realiza lo siguiente:
    1. Emplea el notebook del punto 2 e importa el dataset.
    2. Construye el histograma referente a los datos del inciso anterior.
    3. Evalúa si la gráfica obtenida tiene semejanzas con la distribución normal y calcula la media, la mediana y la desviación estándar de los datos.
    4. Dibuja la gráfica de la distribución gaussiana de los datos.

  7. Finalmente, responde las siguientes preguntas:
    • ¿De qué modo influyen los antecedentes académicos de los padres?
    • ¿Por qué la alimentación es importante al realizar el examen?, ¿qué tendencias observaste en los datos?
    • ¿Qué tanto importa la preparación previa al examen?

 Criterios de evaluación

Ponderación

Crea un notebook usando Google Colab y realiza el programa en Python que calcula la probabilidad indicada en el segundo punto.

20

Emplea el notebook del punto 2 e importa el dataset.

10

Construye el histograma referente a los datos a tratar.

20

Evalúa si la gráfica obtenida tiene semejanzas con la distribución normal y calcula la media, la mediana y la desviación estándar de los datos.

20

Dibuja la gráfica de la distribución gaussiana de los datos.

20

Responde las preguntas planteadas.

10

Total

100


  • Notebook con código en lenguaje Python.
  • Documento con respuestas y comentarios.