CD306 - Manipulación y Preparación de Datos
En este curso se presentarán los fundamentos del lenguaje R para el procesamiento de datos. El énfasis principal del curso será examinar diversos componentes del lenguaje, como lo son funciones, expresiones, librerías, entre otros. Se le dará especial importancia al uso del lenguaje como herramienta de manipulación de información, como punto de partida para el desarrollo de aplicaciones de minería de datos. Para esto se utilizarán diversos paquetes en R para manipulación de datos, así como motores de bases de datos como SQLite y MySQL.
Objetivos de aprendizaje:
En este curso el estudiante será capaz de:
- Utilizar el lenguaje R como mecanismo de extracción de datos e información a partir de repositorios con grandes volúmenes de datos.
- Hacer uso correcto del lenguaje para construir consultas complejas que permitan manipular información de distintas tablas de datos simultáneamente.
- Entender el lenguaje R desde el punto de vista de teoría de conjuntos y lógica de predicados, permitiendo realizar operaciones usuales como lo son uniones, intersecciones, diferencias, entre otros.
- Utilizar SQLite y MySQL como motores de bases de datos basados en SQL.
- Importar información de un Administrador de base de datos SQL a R.
- Exportar resultados obtenidos en R a un Administrador de base de datos SQL.
Metodología:
Basado en la teoría y en la aplicación directa de los conceptos aprendidos. Para esto se dispondrán de las siguientes herramientas:
- Una vídeo conferencia semanal, las cuales quedarán grabadas en Zoom, para que los alumnos la puedan acceder en cualquier momento.
- Trabajos prácticos semanales.
- Foros para plantear dudas al tutor y compañeros disponible 24/7.
- Aula virtual en Moodle con materiales didácticos.
Instructor
M.Sc. Fabio Fernández
Senior Manager Risk Reporting en Scotiabank, Toronto, Canadá. Es Máster en Matemática Aplicada de la Universidad de Costa Rica y tiene un Bachillerato como Ingeniero en Computación del Instituto Tecnológico de Costa Rica. Además fue Analista de Modelación Matemática, Banco Nacional de Costa Rica y profesor de la Escuela de Matemática de la Universidad de Costa Rica.
Asistentes
Oldemar Rodriguez
Ph.D. Matemética
Cesar Vargas
Matemático
Andrés Navarro
Ing. Sistemas