La ingeniería de datos es el medio para comprender un proceso. Los datos pueden generarse de muchas maneras, o un subconjunto de los datos disponibles puede usar técnicas de análisis de datos de estadísticas, aprendizaje automático, reconocimiento de patrones o redes neuronales, junto con otras tecnologías como visualización, optimización, sistemas de bases de datos, herramientas de creación de prototipos y obtención de conocimiento. . El objetivo es utilizar los datos disponibles o generar más datos y así comprender el proceso que se investiga. El proceso de análisis de los datos, la creación de nuevas herramientas de análisis específicamente para la tarea y el trabajo con expertos en el dominio es un aspecto clave de esta tarea de ingeniería.