La review del máster big data analytics de la UPV (parte 2). Estoy escribiendo una serie de artículos sobre mi opinión sobre el máster big data analytics de la UPV y hoy toca hacer un breve resumen de las asignaturas, profesores, etc.

Lo estoy dividiendo en apartados, así que si quieres leer más aquí dejo algunos enlaces:

Breve repaso a asignaturas

Para empezar tengo que decir que yo he cursé el máster en 2016/2017 con lo que habrá asignaturas que queden obsoletas en los próximos años o cambien su contenido.

Para mí, las asignaturas del máster se dividen en dos:

  • Core: O asignaturas importantes en las que vale la pena ahondar mucho (Estadística, Machine Learning, Hadoop/Spark/el framework de turno, bases de datos, replicación, particionamiento, etc.)
  • Morralla: Asignaturas muy de nicho (aspectos legales, procesamiento de texto, análisis financiero, imagen médica, etc.) que están bien, pero es difícil encontrarles interés para la mayoría

Bueno, las asignaturas que me han parecido buenas por su contenido y por el profesor:

Introducción al big data

Me quedo con programación en SHELL y Virtualización (Vagrant cuando yo lo hice). Por dos motivos:

  1. Primero porque el contenido es fundamental. Saber hacer scripts en SHELL y virtualizar entornos es algo que se utiliza sí o sí en el día a día de alguien que se dedique al big data (o a cualquier cosa relacionada con desarrollo de software).
  2. Segundo porque recuerdo al profesor de esas dos asignaturas como un auténtico puto amo. De los mejores del máster.

Más adelante también se toca muy de pasada Docker y Kubernetes.

Estadística

Aquí es cuando te das cuenta de lo importante que es la estadística y que todo lo que aprendas de estadística nunca está de más.

Se dan muchas generalidades, cosas que has dado en la carrera y no te acuerdas porque nunca las has usado, ni las usarás (somos informáticos): variables, distribuciones, probabilidad, tipos de aprendizaje, cálculo de errores, etc…

Aprendizaje automático

Mucho que rascar y se podría hacer un máster sólo de machine learning (de hecho ya lo hay).

Principalmente, se habla de la teoría de probabilidad y un montón de algoritmos de machine learning. Las prácticas son ejemplos sintéticos en Python (nada de casos reales) para entender cómo funcionan.

Los algoritmos no los voy a listar todos, pero son los típicos, desde árboles de decisión hasta redes neuronales. Todo muy superficial, sin demasiados casos reales, pero sirve para hacerse una idea.

Hay una parte más visual de BI (con Pentaho y Tableau) y diseño de algoritmos de manera no programática (con BigML y RapidMiner) que está bien para entender un poco más cómo funcionan.

Gestión de datos en la nube

Un bloque de asignaturas sobre Hadoop y servicios en AWS que me parece de lo mejor del curso principalmente por el profesor. Otro puto amo.

Está muy centrado en AWS y las prácticas son muy guiadas, pero te da una visión muy clara de cómo desplegar servicios en la nube.

NoSQL

Me pareció interesante, más que nada a nivel teórico. No se llega a trabajar con grandes volúmenes de datos, ni te resuelven la típica de duda de “pero qué base de datos es mejor o cuál debería usar” porque obviamente depende.

Se entra en profundidad en Cassanda y MongoDB y es muy interesante toda la parte teórica de cómo se gestionan las réplicas, particionamiento, etc. aún cuando no es algo práctico.

Las prácticas consisten en montar sendos clusters de Cassandra y MongoDB. Bastante útil.

Herramientas Big Data y tiempo real

Por último hay una parte de herramientas avanzadas de big data y tiempo real que darían para otro máster completo.

Para mi gusto, se da en muy poco tiempo las bases de un montón de tecnologías de procesamiento, sin llegar a utilizarlas prácticamente nada o con ejemplos muy sintéticos.

El objetivo parece ser saber distinguir qué hace cada una, para qué sirve, cuando usarla, etc.

Herramientas y frameworks tipo: Spark, Storm, Flink, todo el ecosistema Hadoop, etc. Lo dicho, se trata de una manera muy superficial.

Y con esto llegamos más o menos a febrero/marzo del máster y para mi gusto, todo lo que hay desde ahí hacia el final pierde mucho interés y por tanto no voy a destacar ninguna asignatura más.

Profesores y alumnos

El profesorado en general me parece bueno. Yo distinguiría 3 tipos de proefesores:

  • Profesores de universidad: Hay de todo, desde el que se sienta a leer unas transparencias que no se ha mirado, hasta el que tiene facilidad para enseñar.
  • Profesores de empresa: En este caso, la actitud general de los profesores de empresa me pareció buena, pero creo que tenían poco tiempo para prepararse el material o la asignatura y algunos no transmitían bien todo lo que sabían (en el tiempo que tenían)
  • [email protected] [email protected]: Profesores y profesoras que se salen de lo común y que da igual lo que expliquen que el nivel de detalle y lo bien que explican te hace querer más.

Por lo general, un profesor debería invertir tanto tiempo en preparar el material de la asignatura como la suma del tiempo de los asistentes al curso.

Es decir, si somos 30 personas y una asignatura dura 10 horas, el profesor debería invertir previamente 300 horas en preparar material. Ya os digo así, que hay casos en los que ha sido así (un 10 para esos profesores), pero otros en los que claramente no.

Sobre los alumnos no voy a hablar porque ya me llevé un hostiazo hace unos meses. Lo único que voy a comentar (porque me lo han preguntado) y esto es una opinión porque no tengo datos para confirmarlo, que no hay filtro.

Es decir, yo creo que hay plazas suficientes para la demanda que tiene el curso actualmente, así que si os apuntáis (y pagáis) podéis hacer el máster sin problemas.

Por último dejo por aquí mi opinión sobre el máster.