Cómo construir su portfolio de aprendizaje automático

Soy un físico que trabaja en una startup YC . Nuestro trabajo es ayudar a los nuevos graduados a ser contratados en sus primeros trabajos de aprendizaje automático.

Hace algún tiempo, escribí sobre las cosas que debe hacer para ser contratado en su primer trabajo de aprendizaje automático. Dije en esa publicación que una cosa que debes hacer es crear una cartera de tus proyectos personales de aprendizaje automático.

Pero dejé de lado la parte sobre cómo hacerlo en realidad, por lo que en este post, te diré cómo.

Debido a lo que hace nuestra startup, he visto cientos de ejemplos de proyectos personales que van desde muy buenos a muy malos. Déjame que te cuente acerca de dos de los muy buenos.

El todo incluido

Lo que sigue es una historia real, excepto que he cambiado los nombres por privacidad.

La Compañía X usa AI para alertar a las tiendas de comestibles cuando es hora de que ordenen nuevo inventario. Tuvimos un estudiante, Ron, que realmente quería trabajar en la Compañía X.

Ron quería trabajar en la Compañía X tanto, que construyó un proyecto personal que estaba 100% dedicado a conseguirle un entrevista allí.

Por lo general, no recomendamos ir con todo incluido en una compañía como esta. Es arriesgado hacerlo si estás empezando. Pero, como dije, Ron realmente quería trabajar en la Compañía X.

Entonces, ¿qué construyó Ron?

Los cuadros rojos delimitadores indican que faltan elementos.

  1. Ron comenzó con un conducto pegando su teléfono a un carrito de la compra. Luego condujo su carrito por los pasillos de una tienda de comestibles mientras grababa los pasillos con su cámara. Lo hizo de 10 a 12 veces en diferentes tiendas de comestibles.
  2. Una vez que llegó a casa, Ron comenzó a construir un modelo de aprendizaje automático. Su modelo identificó espacios vacíos en los estantes de las tiendas de comestibles, lugares donde faltaban los copos de maíz (o lo que sea).
  3. Aquí está la parte increíble: Ron construyó su modelo en tiempo real en GitHub, en vista pública completa. Todos los días, impulsaba mejoras a su repo (mejoró la precisión y describía los cambios en el README de su repo.
  4. Cuando la Compañía X se dio cuenta de que Ron estaba haciendo esto, la Compañía X estaba intrigada. Más que intrigada. De hecho, la Compañía X estaba un poco nervioso. ¿Por qué estarían nerviosos? Porque Ron, sin saberlo, y en pocos días, reprodujo una parte de su pila de tecnología patentada. [2]

La Compañía X es excepcionalmente competente y su tecnología se encuentra entre las mejores de su industria. No obstante, dentro de 4 días, el proyecto de Ron había captado la atención personal directa del CEO de la Compañía X.

El proyecto piloto

Aquí hay otra historia real.

Alex es una historia importante con un menor en estudios rusos (en realidad). Inusualmente para un estudiante de historia, se interesó en el aprendizaje automático. Aún más inusual, decidió aprenderlo, a pesar de no haber escrito nunca una línea de Python.

Alex eligió aprender construyendo. Se decidió por construir un clásico. Fier para detectar si los pilotos de combate estaban perdiendo la conciencia en sus aviones. Alex quería detectar esto mirando videos de pilotos.

Sabía que era fácil para una persona saberlo, solo mirando, cuando un piloto está inconsciente, por lo que Alex pensó que también sería posible que una máquina lo dijera.

Esto es lo que hizo Alex, en el transcurso de varios meses. :

Una demostración del detector de pérdida de conciencia inducida por la fuerza G de Alex.

  1. Alex subió a YouTube y descargó todos los videoclips de pilotos que volaban aviones, tomados de la cabina. (En caso de que te lo preguntes, hay algunas docenas de estos clips).
  2. A continuación, comenzó a etiquetar sus datos. Alex construyó una interfaz de usuario que le permitió desplazarse a través de miles de cuadros de video, presionar un botón para “consciente” y otro botón para “inconsciente”, y guardar automáticamente ese cuadro en la carpeta correctamente etiquetada. Este etiquetado fue muy, muy aburrido y le llevó muchos, muchos días.
  3. Alex construyó un flujo de datos para las imágenes que cortarían al piloto fuera del fondo de la cabina, para facilitar que su clasificador se centre en el piloto. Finalmente, construyó su clasificador de pérdida de conciencia.
  4. Al mismo tiempo que estaba haciendo todas estas cosas, Alex estaba mostrando instantáneas de su proyecto a la contratación de gerentes en eventos de redes. Cada vez que sacaba su proyecto y lo mostraba (en su teléfono), le preguntaban cómo lo había hecho, sobre el oleoducto que había construido y cómo había recopilado sus datos. Pero nunca llegaron a preguntar por la precisión de su modelo que era inferior al 50%.

Alex planeaba mejorar su precisión, por supuesto, pero fue contratado antes de que tuviera la oportunidad. Resultó que el impacto visual de su proyecto, y su implacable ingenio en la recopilación de datos, importaban mucho más para las empresas que lo bueno que era su modelo.

¿Mencioné que Alex es uno de los mejores estudios de historia de Rusia?

Lo que tienen en común

¿Qué hizo que Ron y Alex fueran tan exitosos? Aquí hay cuatro cosas importantes que hicieron bien:

  1. Ron y Alex no dedicaron mucho esfuerzo al modelado. Sé que esto suena extraño, pero para muchos casos de uso, hoy en día el modelado es un problema resuelto. En un trabajo real, a menos que esté realizando una investigación de vanguardia en inteligencia artificial, pasará del 80 al 90% de su tiempo limpiando sus datos de todos modos.
  2. Ron y Alex recopilaron sus propios datos. Debido a esto, terminaron con datos más desordenados que los que encontrarías en Kaggle o los datos de UCI. repositorio. Pero trabajar con datos desordenados les enseñó a lidiar con datos desordenados. También los obligó a entender sus datos mejor que si los hubieran descargado de un servidor académico.
  3. Ron y Alex construyeron cosas visuales. Una entrevista no se trata de que tus habilidades sean evaluadas objetivamente por un juez omnisciente Una entrevista es sobre venderte a otro ser humano. Los seres humanos son criaturas visuales. Entonces, si saca su teléfono y le muestra al entrevistador lo que construyó, vale la pena asegurarse de que lo que ha construido se vea interesante.
  4. Lo que hicieron Ron y Alex parece una locura. Y fue una locura. Las personas normales no pegan sus teléfonos a los carritos de la compra. La gente normal no pasa sus días cortando a los pilotos de los videos de YouTube. ¿Sabes quién hace eso? Las personas que harán lo que sea necesario hacen su trabajo Y las compañías realmente, realmente quieren contratar a esas personas.

Lo que Ron y Alex hicieron puede parecer demasiado trabajo, pero en realidad, no es mucho más de lo que se espera que hagas. en un trabajo real Y ese es el punto: cuando no tienes experiencia laboral haciendo X, los gerentes de contratación buscarán cosas que hayas hecho para simular la experiencia laboral haciendo X.

Afortunadamente, solo necesitas hacer un proyecto a este nivel una vez o dos veces: los proyectos de Ron y Alex se reutilizaron una y otra vez para todas sus entrevistas.

Entonces, si tuviera que resumir el secreto de un gran proyecto de LD en una frase, sería: Construir un proyecto con un interesante conjunto de datos que hizo un esfuerzo obvio para recopilar y hacerlo lo más visualmente impactante posible .

**************************** ***********************************

[1] En caso de que se esté preguntando por qué esto es importante, es porque los gerentes de contratación intentan evaluarte mirando tu historial. Si no tienes un historial, los proyectos personales son el sustituto más cercano.

[2] Por supuesto, el intento de Ron estuvo lejos de ser perfecto: la Compañía X había dedicado órdenes de magnitud más recursos al problema que él. Pero fue lo suficientemente similar que rápidamente le pidieron a Ron que hiciera su repo en privado.

Dejá un comentario