¿Qué sabor de Profesional de Datos eres?
Una guía de campo para el universo en expansión de ciencia de datos.
Traducido por Carlos Secada del original por Cassie Kozyrkov (editado por Felipe Chiriboga)
El universo de datos se está expandiendo rápidamente: es hora de que empecemos a reconocer cuán grande es este campo, y que trabajar en una parte de él no requiere automáticamente que seamos expertos en todo. En lugar de esperar que las personas de datos puedan hacerlo todo, comencemos a preguntarnos unos a otros: “¿De qué tipo eres tú?”. Y más importante aún, es hora de que nos hagamos la misma pregunta a nosotros mismos.
Trabajar en una parte del universo de datos no requiere automáticamente que seamos expertos en todo.
Advertencia: Hice estas caricaturas para ayudarte a comenzar a tener un mapa mental, pero todos sabemos que la vida real no siempre colorea perfectamente dentro de las líneas de límite. Por ejemplo, una persona puede usar varios sombreros, o las fases del proyecto pueden sobreponerse, por una iteración no planificada. Por favor no me arrojes tomates por falta de colores.
¿En qué negocio estás?
ML / IA aplicado en el mundo real (ML= Machine Learning; IA = Inteligencia Artificial) reúne todas las laborales relacionadas con las funciones de datos, desde estadísticos hasta ingenieros de confiabilidad. Incluso si has estudiado *todos* los cursos de datos (sí, claro), no hay suficientes horas en el día para que una persona haga todo solo, así que hagamos un safari rápido de roles comunes en el ecosistema de ciencia de datos, explicado con una analogía de la cocina.
No hay suficientes horas en el día para que una persona haga todo solo.
Si explicaras tu trabajo usando términos con los que tus amigos de la industria alimentaria se sintieran como en casa, ¿cuál de estos sería el que aplicaría mejor? (Mi artículo original de analogía de cocina está aquí).
Ingeniería de datos: fuentes e ingredientes del proceso. Esto viene en dos sabores: (1) proporcionar conjuntos de datos para que los científicos de datos los usen y (2) permitir la entrega de datos a escala.
La compra de comestibles es fácil sólo si estás cocinando algo para tu propia cena, pero cuando aumenta la escala, lo trivial se vuelve complejo: ¿cómo adquieres, almacenas y procesas 20 toneladas de helado… sin dejar que nada se derrita? La escala lo convierte en un desafío sofisticado. Del mismo modo, la ingeniería de datos es bastante fácil cuando descargas una pequeña hoja de cálculo para tu proyecto escolar, pero aturde cuando manejas datos a escala de petabytes.
Investigación en ciencia de datos: inventa nuevos tipos de electrodomésticos de cocina. Puedes pensar en esto como el lado de la investigación teórica de la ciencia de datos, y es para lo que te prepara un doctorado en ML / IA / Estadísticas / Optimización. Se trata de crear una teoría para expandir los tipos de problemas que la humanidad puede resolver.
Los investigadores inventan cosas nuevas. Lo emocionante de su carrera es demostrar que lo que antes era imposible es posible. Tienden a disfrutar hasta el prototipado del trabajo, y luego están persiguiendo el próximo desafío. En términos de la analogía de la cocina, se trata de los planos de los electrodomésticos. Quizás conviertan esos planos en un dispositivo que haga el trabajo, pero esperan que los electrodomésticos se mantengan unidos por esperanza y cinta adhesiva… cierran la puerta y se desmoronan. En cuanto a la interfaz, claro, esa secuencia de botones tenía sentido en la cabeza del investigador, pero si intentas usarla te arrancarás el pelo de la frustración. ¿Fácil de usar? ¿Robusto? ¿Bien diseñado? ¡Olvídalo! Ese es el trabajo de otra persona. Tus investigadores están demasiado ocupados descubriendo cómo llevar las capacidades de teletransportación al microondas. (¿Cuándo contratar a un investigador para tu equipo de trabajo? Cuando sabes que necesitas capacidades de teletransportación y nadie ha inventado la teletransportación todavía).
Fabricación de herramientas de datos / Ingeniería de plataformas: construye dispositivos fáciles de usar en cómodas cocinas. Se trata de proporcionar herramientas y plataformas bellamente diseñadas para que científicos de datos las usen.
Los investigadores no suelen fabricar el microondas que realmente tú disfrutarás usando. Es ahí es donde entran los ingenieros de plataforma. Estas personas no inventan nuevos tipos de diagramas de cableado o planos, sino que hacen que los existentes estén disponibles para consumo masivo. El equipo que realiza esta parte del trabajo se reúne para estudiar detalladamente el diseño, la confiabilidad y la eficiencia. Hacen estudios de usuario para asegurarse de que crearán herramientas de las que realmente te enamorarás. Desafortunadamente, no lograrás encontrar a muchos de ellos entrando en escena, hasta que algunos tontos hayan sufrido tratando de demostrar que la versión poco amigable de microonda si tiene mercado. En los inicios del microondas no había versiones a prueba de tontos, producidas y vendidas en masa en tiendas de artículos para el hogar. IA ha estado en ese tipo de estado inicial durante mucho tiempo, pero ahora que resulta útil, ¡los fabricantes de herramientas están avanzando! Este es un momento emocionante porque mucho de lo que crees que es difícil sobre la IA no es intelectual, sino que está relacionado con la calidad de la herramienta. A medida que las herramientas se vuelven más fáciles de usar, más personas comenzarán a ingresar a la IA y más creatividad florecerá.
Inteligencia de Decisión: innovar en recetas y servir platos. Puedes pensar en esto como el lado aplicado de la ciencia de datos. Se trata de resolver problemas comerciales específicos con datos y algoritmos.
Los miembros de los equipos de inteligencia de decisión trabajan para innovar en las recetas. Traerán un investigador de algoritmos a bordo si no tienen suerte con los algoritmos existentes que han probado, y traerán un ingeniero de plataformas al equipo si necesitan herramientas amigables, pero también estarán felices de subcontratar estas funciones. Están más interesados en cocinar, y no sólo cualquier tipo de cocina. Son un tipo diferente de investigador, el tipo que resuelve un problema comercial imposible, inventando una receta increíble hecha a medida. Hay almacenes tras almacenes llenos de electrodomésticos e ingredientes de cocina, y su objetivo es descubrir cómo lograr conseguirte esa pizza sin calorías merecedora de una estrella Michelin.
Si estás en el espacio de ML / IA aplicado, descubramos en qué fase del proyecto trabajas, y luego aumentamos el zoom para encontrar tu rol.
Fases del proyecto para ML / IA aplicada
En la vida real, a menudo hay iteraciones y retrocesos involucrados, pero aquí están las fases a grandes rasgos.
Puesta en marcha: Antes de ir a jugar a la cocina, descubramos cuáles son nuestros objetivos, reunamos al equipo y preparemos nuestra cocina. Si vamos a querer acceder a los microondas, vamos a comprarlos. Si vamos a querer teletransportadores, intentemos inventarlos.
Prototipo: supongamos que nuestro objetivo es hacer una salchicha vegana sin calorías que sepa a algo real. ¿Cuánto tiempo tardará? ¡Quién sabe! Tu cocina espera, ¡buena suerte!
Producción: Tenemos una receta que cumple los requisitos, sirvámosla en todo el mundo durante una decada…
Roles en la fase de puesta en marcha
Tomador de decisiones / gerente de producto: ¿Qué queremos servir a nuestros clientes y qué tan bueno necesita estar? Tú tomas las decisiones y elaboras el plan. Lee más aquí.
Ingeniero / arquitecto de datos: prepara los camiones, configura almacenes y calcula la logística para administrar los ingredientes a gran escala. Lee más aquí.
Investigador: queremos un teletransportador en nuestra cocina. Inventa uno. Lee más aquí.
Fabricante de herramientas / ingeniero de plataforma: el prototipo de teletransportador del investigador se mantiene unido con cinta adhesiva y un rezo. Construye uno que no se desmorone cuando cerramos la puerta. Esta categoría alberga todos los roles de un equipo de software tradicional, desde diseñadores hasta ingenieros de software. Lee más aquí.
Los últimos tres roles se pueden subcontratar (a proveedores de la nube por ejemplo) si no deseas ocuparte de cosas como la configuración de la cocina o el transporte en camiones.
Asegúrate de saber exactamente lo que estás vendiendo: ¿datos? ¿Algoritmos? ¿Herramientas que permiten que otros hagan IA? ¿Soluciones que utilizan IA? Mi consejo es que te concentres en tu negocio principal y dejes que otra persona se ocupe del resto por ti, siempre que sea posible.
Roles en la fase de prototipo
Analista: El almacén y la cocina están a oscuras. No sabemos por dónde empezar. Eres el único con una linterna. Lee más aquí.
Ingeniero de datos: descubre cómo obtener 20,000 toneladas de zanahorias congeladas; no dejes que se descongelen. Lee más aquí.
Ingeniero de ML / IA: juega en la cocina hasta que hayas preparado una salchicha vegana sin calorías que sabe a algo real. Lee más aquí.
Estadístico: ¿Deberíamos agregar este plato al menú? Depende de ti asegurarte de que la receta propuesta sea lo suficientemente buena como para cumplir con los requisitos. Lee más aquí.
Roles en la fase de producción
Ingeniero de ML / IA: Tenemos una receta de prototipo fabulosa. Ajústala y realiza la ingeniería que nos permita servirla a gran escala. Ayuda con el mantenimiento cuando es necesario. Lee más aquí.
Ingeniero de confiabilidad: Organiza la producción y construye redes de seguridad para que podamos servir nuestra receta de manera confiable, incluso si hay escasez de frambuesas. Lee más aquí.
Analista: Monitorea la producción y hace sonar la alarma si algo parece estar yendo mal. Lee más aquí.
Estadístico: Realiza experimentos en vivo para verificar que los usuarios estén contentos y que la receta continúe cumpliendo con los requisitos, especialmente si estamos pensando en aprobar un ajuste a la salsa secreta. Lee más aquí.
Roles para todas las fases del proyecto
Tomador de decisiones / gerente de producto: ¡Guíanos, querido líder! Tú tienes la voz cantante. Lee más aquí.
Experto cualitativo / científico de decisión: Si el responsable de la toma de decisiones no sabe nada sobre alimentos, pero está a cargo de todos modos, será necesario que tu hagas las traducciones entre ellos y todos los demás. Lee más aquí.
Asesor / especialista: Tú eres alguien a quien el tomador de decisiones recurre para obtener asesoramiento sobre un tema específico como ética, UX, etc. Lee más aquí.
Miembro del personal técnico: Tú eres alguien que ayuda a hacer las cosas, aunque tu función no está explícitamente en esta lista. ¡Eso no significa que podamos prescindir de ti! Todos los roles estándar en proyectos de software tradicionales, desde desarrolladores hasta gerentes de proyectos y gerentes de personas, tienen su lugar en la cocina de ML / IA.
Para obtener más información sobre el ecosistema de conceptos, consulta mi artículo Introducción a la Inteligencia de Decisiones.
Obtenga más información sobre ciencia de datos e inteligencia artificial en español aquí.