Institución Facultad de Cs. Físicas y Matemáticas Facultad de Cs. Físicas y Matemáticas
Disponible desde Primavera 2019
Cursos Asociados Otras realizaciones de este Curso
Objetivos El propósito del curso Procesamiento de Lenguaje Natural es introducir a los estudiantes a la disciplina del procesamiento de lenguaje natural (PLN). El estudiante utilizará este método para resolver tareas (task), con soluciones delimitadas respecto a su pertinencia y tamaño. Esta disciplina estudia el diseño de métodos y algoritmos que reciben como entrada y/o producen como salida datos en forma de lenguaje natural (e.g., texto, voz). El curso se centra en el procesamiento de texto aunque se mencionan aplicaciones en procesamiento de voz.

PLN abarca varias tareas (tasks) como por ejemplo: la traducción automática de documentos, el análisis de sentimientos, la detección de entidades y el parsing de árboles sintácticos. Cada tarea (task) se resuelve y se evalúa mediante técnicas y métricas que son propias a esta. El grueso de estas técnicas involucra el uso de algoritmos, métodos estadísticos y redes neuronales artificiales.

Durante el desarrollo del curso el estudiante se verá expuesto a las tareas más relevantes en PLN y reconocerá el funcionamiento detrás de las técnicas más efectivas para solucionar estas tareas como la forma de evaluar cuantitativamente la calidad de una solución. Es importante mencionar que PLN está fuertemente relacionado a la lingüística computacional. Por lo tanto, varios métodos de PLN serán motivados introduciendo conceptos lingüísticos.

El contexto del desarrollo de habilidades de aplicación metodológica será a través del planteamiento de tareas en PLN, con soluciones bien delimitadas respecto a su alcance y tamaño.
Desde el punto de vista teórico, el curso busca que los estudiantes sean capaces de leer artículos científicos en inglés con avances recientes en el área. Desde el punto de vista práctico, se apunta a que los estudiantes sean capaces de implementar soluciones a tareas de PLN utilizando la programación.

En resumen, se espera que los estudiantes desarrollen una metodología de trabajo que los lleve resolver problemas en PLN en base al razonamiento algorítmico, lingüístico y estadístico.
Metodología La metodología de enseñanza y aprendizaje fomenta la participación del estudiante en el aula, las clases son principalmente:

Clase expositiva, en donde el estudiante identifica los problemas fundamentales en PLN así como modelos y técnicas para abordarlos.
Resolución de problemas. En cada unidad el estudiante es expuesto a librerías de programación que permiten implementar modelos de solución a problemas en PLN.

A lo anterior se le suman dos tareas individuales que deben ser desarrolladas con el computador y enviadas a través de u-cursos, además de un proyecto grupal donde se desarrollará una solución a un problema de PLN.
Evaluación Práctica:
2 tareas individuales de programación:
Tarea 1: clasificación de texto.
Tarea 2: etiquetado de secuencias.


Atrasos: se descontará un punto por día hábil de atraso.

1 proyecto grupal:
En el proyecto cada grupo escogerá una tarea (task) en PLN de este sitio: nlpprogress.com/, y deberá desarrollarlo en dos hitos. Los problemas deben ser distintos a los estudiados en las tareas.
Hito 1: presentar al curso la task, las soluciones del estado del arte, las métricas de evaluación y los datasets existentes.
Hito 2: presentar al curso una implementación computacional propia de una solución al problema.
La nota de proyecto se calcula así: 30% nota hito 1 y 70% nota hito 2.
Teórica
5 ejercicios cortos de 15 minutos de duración que serán tomados al principio de cada clase auxiliar. Se eliminará el ejercicio con peor nota.

La nota final se calcula así: 30% para la nota tareas (nota promedio de las dos tareas), 30% para la nota proyecto (calculado como 30% nota hito 1 y 70% nota hito 2) y 40% para la nota de ejercicios (nota promedio de los 4 mejores ejercicios). Para aprobar el curso se debe tener una nota final igual o superior a 4.0.
Programa del Curso 2019_2_CC6205.pdf
Compartir