Cómo construir un equipo de aprendizaje automático

Últimamente, amigos de empresas de todos los tamaños e industrias me han estado preguntando: “¿Cómo aplico el aprendizaje automático a mi negocio?” Esta gente sabe lo suficiente Tener un buen sentido de los casos de uso para el aprendizaje automático. Donde todos se quedan estancados es hacerlo funcionar, contratar personas y hacerlos exitosos.

Resumiré mis tres enfoques principales según el tamaño de su negocio.

Equipos pequeños

Estas son mis recomendaciones para Empresas en etapa temprana o sin fines de lucro con un caso de uso para el aprendizaje automático. Puede parecer imposible que una empresa pequeña, sin fondos o con fondos insuficientes obtenga experiencia de aprendizaje automático en la empresa. La buena noticia es que muchos de los profesionales de ML están entusiasmados con este tipo de trabajo. Busque a alguien que se preocupe por la misión de la empresa. En este tamaño, confiará en su profesional de ML para implementar todo de extremo a extremo, desde la recopilación de datos y la limpieza hasta la implementación. La parte específica de la tarea en el aprendizaje automático es casi ciertamente muy pequeña.

Contratar a alguien que es más importante en el lado de la ingeniería y los datos es definitivamente el camino a seguir. Un ingeniero experimentado que ha regresado a la escuela o ha realizado algún trabajo en línea en aprendizaje automático puede funcionar bien porque el objetivo no es la perfección, es hacer que un sistema funcione de extremo a extremo y luego, lentamente, optimiza todos los pasos. Busco un currículum que muestre la participación en algunas competiciones Kaggle o proyectos autodirigidos. En una entrevista, estoy buscando candidatos que parezcan de mente abierta y pragmáticos. Los investigadores que desean aplicar un tipo de modelo a todo o quieren pasar meses optimizando el flujo de datos antes de construir y probar un modelo no serían una buena opción.

Equipos medianos

Adopto un enfoque ligeramente diferente cuando construyo un forme un equipo en una empresa emergente en crecimiento o mediana que esté interesada en múltiples aplicaciones de aprendizaje automático. A diferencia de Google, no puede permitirse contratar a muchos investigadores. No puede permitirse que sus expertos en aprendizaje automático escriban artículos de investigación. La clave aquí es contratar a un muy buen investigador de aprendizaje automático y rodearlo de ingenieros de datos para que sean extremadamente productivos. Encuentre a una persona que tenga un buen pedigrí y un registro de seguimiento, y asegúrese de que la gente quiera trabajar con ellos. Utilícelos como un recurso valioso, no haga que escriban código, rodéelos de ingenieros que quieran aprender de ellos y que enseñen a los ingenieros cómo aprender de forma automática.

Algunas empresas crean un grupo de aprendizaje automático funcional y otras Las empresas integran la máquina de aprendizaje en equipos. Muchas personas tienen opiniones firmes sobre esto, pero soy pragmático y he visto que ambas estructuras organizativas funcionan. Un solo equipo de aprendizaje automático puede ayudar realmente con el talento, que suele ser el mayor cuello de botella. En este enfoque, debe administrar el equipo con cuidado para asegurarse de que estén trabajando en las tareas más relevantes para la organización. La experiencia en el aprendizaje automático por medio de una organización puede hacer felices a los expertos en aprendizaje automático porque están más cerca del usuario final, pero puede hacer que el reclutamiento sea más difícil.

Es absolutamente crucial contratar más ingenieros de aprendizaje automático que científicos de aprendizaje automático y vincularlos. en las tareas. A menudo, lo que el equipo de aprendizaje automático está optimizando con su algoritmo es fundamentalmente diferente de lo que necesita el negocio. Sin un sistema de extremo a extremo en funcionamiento, esta desalineación puede no ser diagnosticada durante meses. Otro problema común es que los datos de entrenamiento deben modificarse o actualizarse, y esto no se descubre hasta que los algoritmos se entrenan y se implementan. Por estas razones, es crucial lograr que los sistemas de extremo a extremo funcionen lo más rápido posible antes de iterarlos.

Grandes empresas

Al trabajar con muchas grandes empresas, he visto un gran número de los mismos errores y otra vez. En este rango, una empresa puede contratar talento de calidad ML pero no tiene el presupuesto para competir con gigantes de la industria.

Los equipos de élite en Facebook y Google están usando modelos y arquitecturas estándar de código abierto. Recientemente, he hablado con muchas compañías de Fortune 500 que están construyendo sus propias arquitecturas de redes neuronales sin probar si es necesario hacerlo. A los investigadores de aprendizaje automático les encanta investigar, y los gerentes se engañan pensando que los investigadores están construyendo una propiedad intelectual valiosa. Ellos no están. Están perdiendo una tonelada de tiempo reinventando la rueda, y ese tiempo se dedicaría mejor a trabajar en los últimos modelos de vanguardia. Siempre es mejor comenzar con lo más simple, lo más estándar y la capa en complejidad. Cada pieza adicional debe hacer una gran diferencia en el rendimiento del algoritmo.

Las grandes empresas deben evitar construir su propia infraestructura de aprendizaje automático. Casi todas las empresas de tecnología con las que hablo están construyendo su propia pila de aprendizaje automático y tienen un equipo que está muy entusiasmado con esto. Esta tendencia me recuerda a las compañías que construyen sus propios marcos de aplicaciones web en 2005, que trabajan en plataformas personalizadas que serán difíciles de estandarizar. Hay una buena infraestructura por ahí, y está mejorando todo el tiempo. Es mucho más sostenible usar herramientas de código abierto que construir y mantener una infraestructura personalizada.

Las grandes empresas deberían capacitar a sus ingenieros para que aprendan sobre máquina. Los ingenieros están increíblemente ansiosos por aprender el aprendizaje automático, y las herramientas modernas de infraestructura lo están haciendo cada vez más fácil. En este punto, realmente creo que es más eficiente enseñar a los ingenieros el aprendizaje automático que a los profesionales del aprendizaje automático cómo ser buenos ingenieros. En cualquier caso, un ingeniero con alguna capacitación de aprendizaje automático puede ser eficaz de muchas maneras. Algunas compañías están haciendo esto, pero me sorprende que más compañías no estén haciendo una idea de esto.

¿Vale la pena?

La contratación de equipos de ML es costosa y requiere mucho trabajo. Algunas compañías contratan a un equipo de ML para marcar una casilla para los inversores, esto nunca termina bien. Independientemente de su tamaño, si no tiene una aplicación clara para el aprendizaje automático, se arrepentirá de su inversión. Las preguntas cruciales que debe hacerse son:

1) ¿Tengo un problema que pueda resolverse mediante el aprendizaje automático? (Tengo un video sobre esto.)

2) ¿Puedo etiquetar o adquirir datos de capacitación relevantes?

3) ¿El problema que estoy tratando de resolver es crucial para mi negocio? [19659004] Si respondió “sí” a todas estas preguntas, se está preparando para el éxito.

Dejá un comentario