banner
metodología de ciencia de datos

El mundo de la ciencia de datos, como todos actualmente, cambia a pasos agigantados. Metodologías o formas de hacer las cosas que hace 2 años tenían todo el sentido del mundo, pero que actualmente pueden no encajar con la realidad que nos encontramos.

DECIDATA y la Metodología CRISP-DM

En DECIDATA utilizamos una metodología específica para proyectos de ciencia de datos conocida como CRISP-DM, el cual divide en 6 las etapas de un proyecto:

Hace unos años, nos dimos cuenta de la importancia que tiene que un proyecto de ciencia de datos tenga impacto en el negocio. Así fue que modificamos la metodología CRISP-DM y la adaptamos a las necesidades que tenemos en los proyectos que realizamos. De esa necesidad de dedicarle más esfuerzo y tratarlo más en profundidad surgió nuestra “Clínica del Dato”.

Metodología Clínica del Dato

La Clínica del Dato es una metodología propia desarrollada por DECIDATA, un procedimiento participativo para identificar las posibilidades reales de aplicar la Analítica Avanzada en la empresa. A la Clínica del Dato deben asistir tanto perfiles técnicos/datos como perfiles de negocio de las áreas implicadas en los proyectos. De esta forma, evaluamos y definimos proyectos que sean posibles y que tengan un impacto real en el negocio.

En cada clínica del dato analizamos los siguientes aspectos:

Definición

En esta etapa definimos con exactitud el objetivo del proyecto, o como se le conoce también, la pregunta. También tratamos temas como responsables de la toma de decisión, usuarios habituales…

Viabilidad

En esta etapa identificamos cuáles son los factores críticos para el éxito del proyecto.

Factores clave

En esta etapa identificamos los factores más operativos del proyecto que son, identificación de fuentes de datos disponibles, granularidad de la información, accesos etc.

Resultados

En esta etapa identificamos el impacto potencial económico, el impacto potencial operativo directo, el impacto potencial operativo indirecto etc.

Entregables finales de la Clínica del Dato

Los entregables finales de la clínica del dato son un informe detallado sobre el proceso realizado y un canvas de datos, una hoja en el que queda plasmada la información relevante del proyecto. Gracias a que con ‘CANVA’ todo el mundo tiene accesibilidad a la información fundamental del proyecto, este aporta mucho valor por su utilidad a lo largo del proyecto.

Segunda y tercera adaptación sobre CRISP-DM: MLOPS

Pero esta no es la única adaptación que hemos realizado sobre Crisp-dm. La segunda adaptación que realizamos fue en la etapa de evaluación para añadir la integración en negocio como algo fundamental para el éxito del proyecto. La tercera y última adaptación efectuada, es la fase de implantación a la que hemos añadido la metodología MLOPS.

En algunos sitios apodan CRISP-ML a la combinación de CRISP-DM Y MLOps, sinceramente nosotros todavía no le hemos puesto nombre, estamos muy ocupados perfeccionándola.

Como nuestra intención con esta serie de post es hablar de temas que os parezcan interesantes, si este os ha parecido y os interesaría otro post explicando el resto de adaptaciones que hemos procedido sobre CRISP-DM, podéis comentárnoslo por correo o por redes.