Incluir machine learning en curricula de Ingenieria Química

Desde el 11 al 13 de agosto del 2020, se llevó a cabo las Jornadas Técnicas de la Escuela de Ingeniería Química de la Universidad Central de Venezuela (UCV). En esta exitosa jornada tuve la oportunidad de dictar una charla en la cual presenté una posible trayectoria para incluir las técnicas de machine learning en el perfil del ingeniero químico.
Mi propuesta de integración de ambos universos parte de la formación en procesos industriales que posee el ingeniero quimico egresado de la UCV y se enfoca en “enseñar” física a los modelos de machine learning.
Destaco dos conceptos que soporta mi propuesta: Industria 4.0 en la cual se combina los productos físicos con la inteligencia proveniente de los datos del proceso y Digital Twin que representa un modelo de convergencia físico-virtual que busca representar un espejo fidedigno del proceso real.
El aspecto que considero clave para la integración del area de Machine Learning e Ingeniería de Procesos recae en el hecho que el digital twin sirve de conexion/comunicacion entre la estructura para el análisis de datos propuesto por Data Science (CRISP-DM) y el monitoreo del proceso productivo a tiempo real basado en el modelo y simulación de procesos.
El bloque Off-IoT computing (ver imagen superior) representa la parte de machine learning que se debe manejar y para ello es necesario repasar/aprender/profundizar el conocimiento en el area de programación, estadística y técnicas de machine learning. De esta manera, propongo la siguiente ruta y su enlace con cursos disponibles en la plataforma de Coursera.
- Python 3. Existen varios lenguajes de programación, cada uno con sus ventajas y desventajas. Python es uno de los simples de aprender y con una amplia librería y soporte que agiliza el proceso de aprendizaje.
- Data Science con Python. Este curso le muestra los aspectos fundamentales de la metodología CRISP-DM usando Python
- Fundamentos de Machine Learning. Es necesario conocer el overview de los distintos métodos y técnicas que se emplean en Machine Learning. Es un ecosistema vasto y no creo que sea prudente profundizar en todos, sino elegir los que son adecuados para el área de trabajo.
- Estadística Inferencial. Considero que es la parte de estadística fundamentales que se debe manejar para hacer uso correcto de los métodos estadísticos en las predicciones de los resultados.
- SQL para Data Science. Aunque existe varias arquitecturas para almacenar la data de los procesos que pueden tener más ventajas que las tradicionales bases de datos estructuradas siguen siendo el lenguaje SQL ampliamente utilizado, por lo cual considero que debe conocer muy bien.
- Machine Learning Avanzado. Aunque inicialmente se diferenciaba las técnicas de ML con Deep Learning pienso que es posible entrenar las redes neuronales con modelos más simples basados en la respuesta física que se pueden implementar en Machine Learning. De esta manera, este curso muestra métodos de ML más avanzados.
- AWS para Data Science. El deployment de las soluciones en un paso fundamental en los proyectos de DS llevados a cabo por los machine learning engineers y aunque es un área cuya programación es adecuada para profesionales en las ciencias de la computación, pienso que es necesario manejar los aspectos básicos de la implementación de la solución en la nube.
Esta es mi propuesta de los conceptos que se deben manejar en machine learning para aprender cómo implementar la físicas en los modelos de ML.
Recomendaciones finales
- Recomiendo tomar los cursos en el orden propuesto pero no es obligatorio, depende del nivel que cada quien posea.
- Es mejor ir implementando lo que se va aprendiendo en proyectos simples o en el mismo trabajo. La practica hace al maestro.
- Selecciona las preguntas que quieres responder en tu area de trabajo para que puedas seleccionar las técnicas de machine learning que mejor se adaptan.