Aplicar los comandos de la librería Natural Language Toolkit de Python para el procesamiento de lenguaje natural y analizar los resultados obtenidos.
En este tema aprenderás sobre los recursos léxicos, el concepto de corpus y lo aplicarás al desarrollar un programa en Python para el análisis de texto.
Los siguientes enlaces son externos a la Universidad Tecmilenio, al acceder a ellos considera que debes apegarte a sus términos y condiciones.
Para conocer más sobre lingüística computacional basada en corpus, te recomendamos leer:
NLTK Project. (2021). Natural Language Toolkit. Recuperado de https://www.nltk.org
Analizar un conjunto de datos.
El trabajo práctico que se realizará utiliza programación en Python y una librería de código abierto, Natural Language Toolkit (NLTK 3), utilizada para procesamiento de lenguaje natural.
Calcula las frecuencias a nivel de caracter y de palabra del corpus de “Movie reviews” distribuido dentro de NLTK. Para mayor referencia sobre los corpus, consulta la fuente:
NLTK. (2021). Documentation. Recuperado de https://www.nltk.org/howto/corpus.html
El siguiente enlace es externo a la Universidad Tecmilenio,
al acceder a éste considera que debes apegarte a sus términos y condiciones.
Asegúrate de: