CD200 - Métodos Avanzados en Minería de Datos
En este curso se estudiarán en detalle las técnicas de Validación Cruzada (Cross-Validation) y Remuestreo (boostrapping) con el objetivo de calibrar y seleccionar el mejor método de Minería de Datos para un problema y juego de datos dado.
Se estudiará como programar y automatizar la Validación Cruzada (Cross-Validation) y Remuestreo (boostrapping) en el lenguaje R.
Los ejemplos de este curso estarán motivados por problemas reales en el campo. Por lo tanto, los estudiantes adquieren conocimientos de muchas herramientas diferentes que pueden combinarse para resolver problemas reales.
Objetivos de aprendizaje:
- Escribir programas en R para Validación Cruzada (Cross-Validation) y Remuestreo (bootsrapping).
- Aplicar adecuadamente una Validación Cruzada y un Remuestreo.
- Instalar y utilizar paquetes avanzados en R.Calibrar adecuadamente tanto métodos exploratorios como métodos predictivos en Minería de Datos.
- Seleccionar el mejor modelo predictivo dado un conjunto de datos.
- Instalar y utilizar paquetes avanzados en R.
Metodología:
Basado en la teoría y en la aplicación directa de los conceptos aprendidos. Para esto se dispondrán de las siguientes herramientas:
- Una vídeo conferencia semanal, las cuales quedarán grabadas en Zoom, para que los alumnos la puedan acceder en cualquier momento.
- Trabajos prácticos semanales.
- Foros para plantear dudas al tutor y compañeros disponible 24/7.
- Aula virtual en Moodle con materiales didácticos.
Instructor
Ph.D. Oldemar Rodríguez
Catedrático de la Universidad de Costa Rica, tiene un Ph.D. del UFR Matemáticas de la Decisión de la Universidad de París - PSL y un diploma postdoctoral de la Universidad de Stanford en California en "Data Mining and Applications". En la Universidad de Costa Rica obtuvo su bachillerato y licenciatura en Matemática Pura y en el Instituto Tecnológico de Costa Rica se graduó como Máster en Ciencias de la Computación.
Asistentes
César Vargas
Matemático
Diego Jiménez
Ing. Sistemas