En los últimos años ha crecido enormemente la demanda de profesionales en las áreas de Big Data y Data Science. Las ofertas de empleo reflejan el interés que tienen empresas e instituciones en encontrar especialistas en el uso de tecnologías basadas en clusters de computadores.

Este curso permite adquirir los conceptos esenciales y conocer las herramientas de programación más utilizadas y demandadas en la actualidad para el trabajo con datos: los clusters basados en Hadoop y la programación paralela con Spark.

OBJETIVOS

  • Comprender el marco conceptual y los retos del Big Data
  • Grandes volúmenes de datos: Clusters y programación paralela
  • Apache Hadoop, Apache Spark y ecosistema asociado
  • Utilización del sistema de ficheros distribuido Hadoop HDFS
  • Parámetros de optimización de tareas en sistemas Hadoop HDFS
  • Esquema de programación MapReduce (Hadoop MapReduce)
  • Programación en Python para Apache Spark
  • Ajustes para mejorar la eficiencia de tareas Spark
  • Módulos de Spark para dominios particulares: SQL, MLlib

CARACTERÍSTICAS

Profesorado experto
Grupos reducidos (~20 alumnos)
25 horas presenciales
Software Libre
Campus virtual Moodle
Casos prácticos
Clases en laboratorio
Evaluación por trabajos
Matrícula 220€

CUÁNDO

Del 2 al 13 de julio de 2018.
De Lunes a Jueves de 10:00 a 13:30

DÓNDE

Facultad de Matemáticas.
Ciudad Universitaria.

TÍTULO

Certificado Académico UCM y reconocimiento de 1,5 créditos optativos.

BECAS

4 becas, 2 totales y 2 parciales.
Se valorarán el expediente académico y los ingresos.

Ficha del curso

Aquí tienes la información ampliada en pdf

Acceso al sistema de matriculación

Código UCM del curso: 0588-C588

Nota importante: La UCM está teniendo problemas con la matriculación on line. Para formalizar la matrícula después de haber realizado la preinscripción hay que llamar al teléfono 91 394 6527 (Yolanda).

Contacto

Facultad Matemáticas UCM:
   Luis Fernando Llana Díaz
   Carlos Gregorio Rodríguez