¿Qué hace un científico de datos en una startup?

Un científico de datos en una startup hace:

  1. Las mismas cosas que en una gran empresa, bajo una tremenda presión de infraestructura.
  2. Las mismas cosas que en una gran empresa, bajo una tremenda presión del producto.
  3. Las mismas cosas que en una gran empresa, bajo una tremenda presión de ingeniería.

En una gran empresa, un científico de datos puede asumir que la infraestructura está configurada, los datos están listos para ser procesados ​​y cualquier descubrimiento no insignificante multiplicado por el número de usuarios activos puede mostrar una mejora lo suficientemente significativa como para que valga la pena perseguirla. Y tienen razón: si un equipo de dos científicos de datos, dos ingenieros y un gerente, descubre tres ideas, dos de las cuales son buenas y una vale la pena escindir como una nueva característica del producto, es un gran resultado para un mes de trabajo. de este equipo

En una startup, es un gran resultado de una semana de trabajo de un ingeniero de datos.

Las grandes empresas pueden permitirse dividir los equipos de datos en ciencia e infraestructura. Hay muchas razones para hacerlo. Por un lado, el almacenamiento de datos y las soluciones de procesamiento son relativamente independientes del producto, y por otro lado, los científicos de datos no tienen que comprender los protocolos, la replicación, el fragmentación y otros componentes internos de datos para hacer su trabajo.

Para una startup, separar los equipos de ciencia de datos y de infraestructura de datos es otra forma efectiva de suicidio (*). Por demasiadas razones que son demasiado buenas, la principal es que el conocimiento del panorama del producto medio año después simplemente no existe. En un inicio, la infraestructura se construye para enviar características basadas en datos, y qué características son las mejores para construir es lo que la ciencia de los datos debería decir. Cuando las decisiones deben tomarse dentro de varios días, idealmente, varias horas, mantener dos equipos y organizar una comunicación fluida entre ellos es un lujo sin precedentes.

Fuera de la tecnología, cada startup finalmente gira. No se ejecuta ningún plan de negocios tal como se planificó, y ninguna visión del producto puede describir con precisión la característica que se va a construir, junto con describir su hoja de ruta y trayectoria de adopción en detalle.

Lo primero que hace un buen científico de datos en una startup es enumerar los supuestos básicos y encontrar formas de validarlos.

Se debe confiar en algunos supuestos como la base fundamental de la propia startup. La mayoría, sin embargo, puede ser probada, si se aborda con cuidado, y se deja de lado sin sacrificar el futuro de la empresa, si se identifican y refutan desde el principio.

  • ¿Quizás un cuadro para ingresar más texto es mejor que compartir con un solo clic?
  • ¿Quizás algún clic que estamos luchando por eliminar en una interacción es realmente vital, y ese botón es mejor moverlo a un lado diferente de la pantalla lo antes posible para reducir los clics erróneos?
  • ¿Quizás esa opción del menú contextual es mejor para promocionar a un deslizamiento, o un doble toque?
  • Quizás algunos correos electrónicos de marketing que enviamos funcionan mejor que otros. En caso afirmativo, ¿cuál es la propiedad común que comparten? (**)
  • ¿Quizás algo tan simple como el idioma, el formato, la hora en que los enviamos o simplemente los enlaces rotos para uno de los clientes de correo electrónico más populares?
  • ¿Las métricas que estamos tratando de mejorar son críticas para el negocio?
  • ¿Cuál es el margen de maniobra de nuestra personalización? ¿Cómo lo probamos?
  • ¿Es la búsqueda una característica importante? (***)

Las nuevas empresas dedican la mayor parte de su etapa inicial a investigar el mercado y a buscar la oferta de productos adecuada para ejecutar. A diferencia de una empresa establecida, un error en la definición del producto puede costarle a la startup su futuro. Las primeras decisiones estatales deben tomarse con prudencia, y lo mejor es tomarlas con datos disponibles.

Por supuesto, hay un equilibrio para atacar. La personalidad de Steve Jobs es, con mucho, el mayor problema. La mayoría de los CEOs en estos días creen que deberían y pueden permitirse el lujo de actuar como él, lo que significa que muestran su ego temprano, y se muestran rápidamente audaces e ignoran las entradas de datos, ya que esas entradas contradicen sus creencias. Los ejemplos de esto son numerosos: imagen de fondo de Google que todos odiaban, rediseñando el servicio de recomendación de películas, enfocándose en la apariencia antes de la funcionalidad, etc., etc.

Un buen científico de datos de inicio se parece mucho a un buen fotógrafo. Ella tomaría cien fotos, pero publicaría solo una: la gente de arte puro admira y recuerda.

Además de lo anterior, la ciencia de datos debe apoyar las decisiones de infraestructura. Los ingenieros son famosos por gustarles sus diseños y proceder a implementarlos en caso de que no haya obstáculos. Sin orientación, esto da como resultado múltiples pensamientos profundos de pilares, sin pegamento para conectarlos. En una empresa centrada en ingenieros, la situación es mejor, ya que los fundadores y la alta dirección aseguran la presencia del pegamento. Pero el verdadero desafío de escalar no es la base de ingeniería; Es la base de datos.

Datos calientes frente a datos fríos: algo que debe mantenerse en la memoria y acceder en una latencia de menos de milisegundos frente a algo que debería escalar hasta la capacidad de petabytes sin romperse por su propio peso. La compañía eventualmente los necesitará a ambos. El que aparece primero no debe ser conducido por ingenieros apasionados por implementar sus soluciones, y no por la gerencia que cree en una imagen de un castillo en el cielo que han pintado para sí mismos. La decisión debe ser impulsada por los datos.

Presentar un argumento para convencer a la empresa de que tome la decisión estratégica correcta es lo que realmente es el trabajo de un científico de datos en una empresa estatal temprana.

Para concluir, al igual que la ciencia de los datos, un ingeniero de datos está esposado hasta que cuenta con el apoyo de un sólido equipo de ingeniería, productos, experiencia de usuario, marketing y ejecutivos. Más que nada, lo que más perjudica el rendimiento de un ingeniero de datos es la ausencia de datos. Por lo tanto, al tomar una decisión sobre cuándo y cómo contratar una, la pregunta correcta no es “No tenemos idea, ¿nos ayudan a entender qué está pasando aquí?”, Sino “¿Cuál es la mejor manera de aprovechar todos esos flujos de datos? estamos a punto de coleccionar por diversión y beneficio ”

El mejor momento para obtener un ingeniero de datos sólido es cuando se definen esos flujos de datos. Pero asegúrese de que llegar al primer millón de eventos de usuarios no sea más de un cuarto en el futuro.

Depende de lo que haga la startup. En ParallelDots, donde el producto principal es un motor de recomendación, toda la pila es Data Science-ish. Los algoritmos de aprendizaje automático y texto son el centro de todo lo que hacemos, desde servicios web hasta análisis.
También he trabajado como consultor para startups B2C (aplicación móvil). Aquí he trabajado en segmentar usuarios / elementos, modelar estadísticamente los hábitos de los usuarios, analizar los datos de IoT del usuario (ubicación / movimiento), etc.
Entonces, sí, puede haber mucho que hacer, pero eso depende de cuánto arranque quiere explorar esto.

More Interesting

¿Por qué la mayoría de las empresas o startups indias discriminan entre IITianos y no IITianos?

¿Necesitas un título para ser contratado por empresas como Google, o incluso por nuevas empresas y unicornios tecnológicos (o no tecnológicos)?

¿Su empleador lo ayuda a aprender y avanzar en su carrera?

¿Pueden los blogs ser una carrera a tiempo completo?

¿Alguien puede conseguir un buen trabajo en Silicon Valley sin un título? ¿Es una persona que es buena en informática, desarrollo de software y programación y puede mostrar sus habilidades capaz de competir de manera justa con una persona de MIT / Caltech?

¿En qué startups puede postularse un puesto más nuevo para un puesto de analista de datos y, lo que es más importante, de un fondo de ingeniería civil?

¿Qué Startups contratan ingenieros electrónicos y de comunicación?

¿Qué tipo de trabajo combinaría finanzas y tecnología?

¿Por qué debemos aprender a codificar? Para las personas que no participan en el diseño de software, la interacción del usuario o cualquiera de las aplicaciones obvias de la codificación, ¿por qué aprender a codificar y cómo podría ser útil este conocimiento?

Cómo encontrar un trabajo en una startup acelerada y prepararme para trabajar allí después de graduarme

¿Cómo puede un estadounidense encontrar oportunidades en nuevas empresas fuera de los Estados Unidos?

¿Puedo ofrecerle a mi empleador que compre mi startup?

¿Cómo puede un ingeniero de software ayudar a la estrategia de crecimiento?

¿Qué significa ser un Consultor Fintech?

¿Qué debo hacer con mi startup si estoy cansado de trabajar solo en él?