El plan de estudios contempla 5 módulos que cubren distintos aspectos del aprendizaje de ciencia de datos. En el primer módulo, las y los estudiantes son introducidos al lenguaje de programación R y al ambiente de desarrollo integrado más usado en la actualidad (RStudio). El Módulo 2 profundiza la visualización y transformación de datos.
El tercer módulo prepara a las y los estudiantes para entender algoritmos de la ciencia de datos que requieren de conocimiento estadísticos y probabilísticos para su correcta evaluación e interpretación. El cuarto módulo construye sobre lo aprendido en el módulo introductorio y en el tercer módulo de probabilidad y estadística, prepara a estudiantes para adquirir y analizar de forma programática datos de fuentes no tradicionales, incluyendo datos narrativos o texto.
Finalmente, el quinto módulo los introduce a algunas herramientas usadas en las industrias ligadas a ciencia de datos, con el objetivo de facilitar la inserción y desempeño profesional de las y los estudiantes. Estas herramientas apuntan a facilitar el trabajo profesional abstrayendo el aspecto de programación y reuniendo en un solo lugar muchos algoritmos distintos con una configuración inicial predeterminada generalmente útil, permiten que el usuario ajuste o mejore los criterios predeterminados mediante el uso de instrucciones en R o Python