Este curso ofrece una formación integral y rigurosa en Procesamiento de Lenguaje
Natural (NLP), abarcando desde los modelos vectoriales clásicos del lenguaje — como
TF-IDF y análisis semántico — hasta las técnicas modernas de aprendizaje profundo basadas en redes neuronales, embeddings, CNNs, RNNs, LSTMs y Transformers. A lo largo del curso, el estudiantado comprenderá cómo las máquinas representan, procesan y generan lenguaje humano, y cómo estas representaciones se utilizan en aplicaciones reales como modelos de lenguaje de gran escala, extracción de información, grafos de conocimiento y motores de diálogo. El curso culmina con un enfoque práctico y aplicado, donde se diseña e implementa un chatbot inteligente utilizando TensorFlow y arquitecturas Transformer, incluyendo el preprocesamiento de datos, tokenización, mecanismos de atención y atención multi-cabeza, integrando fundamentos matemáticos, estadísticos y algorítmicos con soluciones reales
de la industria.
Objetivos
-
Comprender los fundamentos teóricos del Procesamiento de Lenguaje Natural, incluyendo modelos vectoriales del lenguaje, representaciones basadas en conteos y análisis semántico, como base para el tratamiento computacional del lenguaje natural.
-
Analizar y aplicar modelos de aprendizaje profundo para texto, tales como embeddings, redes neuronales, CNNs, RNNs, LSTMs y arquitecturas Transformer, entendiendo su funcionamiento matemático y algorítmico.
-
Diseñar e implementar soluciones prácticas de NLP, integrando técnicas modernas para el desarrollo de aplicaciones reales como modelos de lenguaje, extracción de información, grafos de conocimiento y sistemas conversacionales.
-
Construir e implementar un chatbot inteligente con TensorFlow, dominando el flujo completo del proyecto: preparación de datos, tokenización, mecanismos de atención, atención multi-cabeza y despliegue del sistema.
Metodología:
El curso combinará teoría y práctica aplicada en Python, permitiendo a los estudiantes crear agentes de Inteligencia Artificial. Las herramientas y recursos incluyen:
-
Videoconferencias semanales:
Sesiones en Zoom que serán grabadas para su revisión posterior. -
Trabajos prácticos:
Ejercicios aplicados en Python para aplicar el Procesamiento de Lenguaje Natural en problemas de la industria. -
Foros de discusión:
Espacio en Moodle para la resolución de dudas y discusión de temas del curso. -
Aula virtual en Moodle:
Acceso a materiales, ejemplos de código y recursos adicionales.
Ph.D. Oldemar Rodríguez
Catedrático de la Universidad de Costa Rica, tiene un Ph.D. del UFR Matemáticas de la Decisión de la Universidad de París - PSL y un diploma postdoctoral de la Universidad de Stanford en California en "Data Mining and Applications". En la Universidad de Costa Rica obtuvo su bachillerato y licenciatura en Matemática Pura y en el Instituto Tecnológico de Costa Rica se graduó como Máster en Ciencias de la Computación.
Profesores asistentes
César Vargas
Matemático
Diego Jiménez
Ing. Sistemas