Alcance de proyectos de ciencia de datos

Compartir esta publicación

El alcance del proyecto de ciencia de datos es un proceso iterativo y el alcance se refina tanto durante el proceso de alcance como durante el proyecto, sin embargo, es importante tener un alcance inicial para tener una idea de los objetivos, plazos, costes y requisitos del proyecto.

Alcance de proyectos de ciencia de datos

En primer lugar, es fundamental identificar a las principales partes interesadas en el proyecto, incluidas las personas que entienden el problema empresarial/político, las personas que entienden qué datos están disponibles, las personas que consumirán los resultados del sistema o tomarán medidas utilizándolo, y las personas que se verán afectadas por él. 

Una vez que los hemos identificado, es muy importante entender el problema y el impacto que tiene en el negocio. 

1. Entender el problema

Uno de los elementos clave aquí es comprender la verdadera necesidad del proyecto. En la mayoría de los casos, una vez que se empieza a profundizar, se ve que el iceberg es enorme y el problema es más grande de lo que los interesados pueden pensar. 

La comprensión del negocio es el primer paso crítico de cualquier proyecto de Ciencia de Datos. Hacer muchas preguntas «por qué» durante las reuniones iniciales ayuda al equipo a definir mejor las cuestiones más importantes en el centro del proyecto. Por ejemplo, si la tarea es «Necesitamos tener más información sobre nuestros usuarios», el equipo de Ciencia de Datos puede preguntar: «¿Por qué quieres saber más sobre ellos? ¿Cuál es el objetivo? ¿Quiere volver a comercializar con ellos? ¿Queremos que se comprometan más? Si la respuesta es compromiso, entonces «¿cuáles son algunos comportamientos que muestran que los clientes están comprometidos?» El equipo de Ciencia de Datos puede identificar el problema empresarial de fondo, los puntos de dolor clave, y diseñar una solución procesable con un impacto medible. 

  Entrevista sobre machine learning con Gema Parreño - Científica Principal de Datos en Apiumhub

Además, es muy importante saber a quién o qué afecta el problema, a cuántos afecta y en qué medida (la magnitud del problema). Por ejemplo, las bajas ventas durante la primera semana de agosto. ¿Qué mercados? ¿Alguna pieza específica o las bajas ventas en general? ¿Sección infantil o en general? 

A continuación, el equipo de ciencia de datos suele pedir a la organización que explique por qué el problema es prioritario ahora y cómo lo ha abordado. Entender cómo la organización ha abordado el problema puede ayudar al equipo de ciencia de datos a identificar las formas en que el análisis de datos puede informar las acciones de la organización para lograr sus objetivos. 

2. Definir los objetivos

Al definir los objetivos hay que tener en cuenta el contexto, las necesidades, la visión y los resultados. 

La pregunta clave aquí es cómo se medirá el éxito de la solución.  

Sea tan específico como pueda, por ejemplo: «Aumentar las ventas totales de agosto en un 30%». El objetivo aquí es tomar el resultado que estamos tratando de lograr y convertirlo en una meta que sea medible y alcanzable. 

3. Definir qué datos se tienen y qué datos se necesitan

Es muy importante hacer una lista de las fuentes de datos que están disponibles dentro de la organización. Este es un proceso iterativo, ya que muchas organizaciones pueden no tener una lista completa de sus fuentes de datos.  Otras preguntas clave aquí son: ¿qué datos necesita? ¿Puede empezar a recopilar los datos? ¿Puede comprar los datos? ¿Puede utilizar legal o éticamente los datos previstos?

¿Cómo de limpios son estos datos? etc. 

  Introducción a Pandas - Lección 4

4. ¿Qué análisis hay que hacer?

Los análisis pueden utilizar métodos y herramientas de diferentes áreas: informática, aprendizaje automático, ciencia de los datos, estadística y ciencias sociales. ¿Se trata de un análisis descriptivo, de un modelo predictivo o de una tarea de detección o cambio de comportamiento? ¿Cómo se validará el análisis? ¿Qué validación puede hacerse utilizando datos históricos existentes? 

¿Cómo va a desplegar su análisis como un nuevo sistema para que pueda ser actualizado e integrado en las operaciones de la organización? ¿Cómo evaluará el nuevo sistema sobre el terreno para asegurarse de que cumple sus objetivos? ¿Cómo va a supervisar su sistema para asegurarse de que sigue funcionando bien a lo largo del tiempo?

Una vez que tengas claras estas etapas, podrás ver qué perfiles necesitas para hacer realidad este proyecto de ciencia de datos: líder de ciencia de datos, ingeniero de ML, desarrollador de python, etc. 

Si necesitas ayuda con la estimación y el alcance de tu proyecto de ciencia de datos, ¡háznoslo saber! Somos expertos en este campo. 

Author

  • Ekaterina Novoseltseva

    Ekaterina Novoseltseva is an experienced CMO and Board Director. Professor in prestigious Business Schools in Barcelona. Teaching about digital business design. Right now Ekaterina is a CMO at Apiumhub - software development hub based in Barcelona and organiser of Global Software Architecture Summit. Ekaterina is proud of having done software projects for companies like Tous, Inditex, Mango, Etnia, Adidas and many others. Ekaterina was taking active part in the Apiumhub office opening in Paseo de Gracia and in helping companies like Bitpanda open their tech hubs in Barcelona.

    Ver todas las entradas
  Cómo mostrar información heterogénea en UITableViews

Leave a Reply

Your email address will not be published. Required fields are marked *

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

Suscríbete a nuestro boletín de noticias

Recibe actualizaciones de los últimos descubrimientos tecnológicos

¿Tienes un proyecto desafiante?

Podemos trabajar juntos

apiumhub software development projects barcelona
Secured By miniOrange