El aprendizaje automático de máquinas es el nuevo niño de la ciudad y está aquí para quedarse. Nos está ayudando a crear modelos mejores y mejores con API fáciles de usar y excelentes. Aquí te hablaré sobre Auto-Keras, el nuevo paquete para AutoML con Keras. Hay una sorpresa al final;).
Antes de comenzar, una gran cita de Matthew Mayo sobre lo que AutoML no es:
AutoML no es ciencia de datos automatizada. Si bien es indudable que se superponen, el aprendizaje automático no es más que una de las muchas herramientas del conjunto de herramientas de ciencias de la información, y su uso en realidad no tiene en cuenta todas las tareas de ciencias de datos. Por ejemplo, si la predicción será parte de una tarea de ciencia de datos dada, el aprendizaje automático será un componente útil; sin embargo, el aprendizaje automático puede no jugar en absoluto en una tarea analítica descriptiva.
Muy bien, entonces, ¿qué es el aprendizaje automatizado de máquinas? En palabras simples hay una manera de automatizar las tareas de ( https://www.automl.org/automl/ ):
- Preprocesar y limpiar los datos.
- Seleccione y construya las características apropiadas.
- Seleccione una familia de modelos adecuada.
- Optimizar los hiperparámetros del modelo.
- Modelos de aprendizaje automático posterior al procesamiento.
- Analice críticamente los resultados obtenidos.
Ahora que tenemos claro qué es AutoML ahora, ¿qué es Keras?
Keras es una API de redes neuronales de alto nivel, escrita en Python y capaz de ejecutarse sobre TensorFlow CNTK o Theano . Fue desarrollado con un enfoque en permitir la experimentación rápida. Poder pasar de la idea al resultado con la menor demora posible es la clave para hacer una buena investigación.
Esto fue creado por François Chollet y fue el primer paso serio para hacer que Deep Learning sea fácil para las masas.
TensorFlow tiene una La API de Python no es tan difícil, pero Keras hizo muy fácil acceder a Deep Learning para muchas personas. Cabe señalar que Keras ahora es oficialmente parte de Tensorflow:
Módulo: tf.contrib.keras | TensorFlow
Genial. Ahora que sabemos qué es Keras y AutoML, vamos a combinarlos. Auto-Keras es una biblioteca de software de código abierto para el aprendizaje automático de máquinas. Auto-Keras proporciona funciones para buscar automáticamente arquitectura e hiperparámetros de modelos de aprendizaje profundo.
Instalación
Uso
Para el uso, voy a usar un ejemplo que tienen en su web. Pero primero veamos cómo podemos hacer lo mismo con diferentes herramientas. Usaré el famoso y odiado conjunto de datos MNIST.
MNIST es un simple conjunto de datos de visión por computadora. Consiste en imágenes de dígitos escritos a mano como estos:
También incluye etiquetas para cada imagen, diciéndonos qué dígito es.
MNIST en TensorFlow usando la ejecución de Eager:
Recursos:
No es tan fácil, pero está muy bien explicado en el ejemplo. TensorFlow no pretende ser la herramienta más fácil para el aprendizaje profundo, sino una herramienta rápida y confiable. Con una ejecución ansiosa, el código es mucho más legible.
MNIST con PyTorch:
Recursos:
MNIST con Keras:
Recursos:
Puede ver que hasta ahora el paquete Keras es el más simple para ejecutar este ejemplo. Es un gran paquete con increíbles funciones para pasar de cero a un modelo en cuestión de minutos.
Pero ahora, la guinda del pastel.
MNIST con Auto-Keras:
Sí, eso es todo. Bastante simple ¿verdad? Solo necesita un ImageClassifier, luego ajuste los datos y evalúe. Usted tiene un final_fit allí también, y está ejecutando un entrenamiento final después de encontrar la mejor arquitectura.
Por ahora usted tiene el ImageClassifier, el BayesianSearcher, un módulo Graph, un PreProcessor, un LayerTransformer, un NetTransformer , un ClassifierGenerator y algunas utilidades. Este es un paquete en evolución, eche un vistazo al descargo de responsabilidad de los creadores:
Tenga en cuenta que esta es una versión preliminar de Auto-Keras que todavía se está sometiendo a pruebas finales antes de su lanzamiento oficial. El sitio web, su software y todo el contenido que se encuentra en él se proporcionan “tal como están” y “según estén disponibles”. Auto-Keras no otorga ninguna garantía, ya sea expresa o implícita, en cuanto a la idoneidad o usabilidad del sitio web, su software o cualquiera de sus contenidos. Auto-Keras no será responsable de ninguna pérdida, ya sea que dicha pérdida sea directa, indirecta, especial o consecuente, sufrida por cualquier parte como resultado de su uso de las bibliotecas o el contenido. Cualquier uso de las bibliotecas se realiza por cuenta y riesgo del usuario y el usuario será el único responsable de cualquier daño a cualquier sistema informático o pérdida de datos que resulten de dichas actividades. En caso de encontrar errores, fallas, falta de funcionalidad u otros problemas en el sitio web, avísenos inmediatamente para que podamos corregirlos en consecuencia. Su ayuda en este sentido es muy apreciada.
De cualquier manera es un paquete increíble que es muy útil y lo será en el futuro. Para obtener más información sobre AutoML y paquetes, vea esto:
¡Oh! Si quieres una forma incluso más simple para hacer AutoML y Deep Learning sin codificación en absoluto echa un vistazo Deep Cognition y mis publicaciones sobre él:
¡Y ahora para la sorpresa final! Si llegaste aquí, creo que estás interesado en aprender cosas nuevas. Me uní a mi amigo Matthew Dancho en el increíble campo de la creación de cursos para personas que quieren convertirse en científicos de datos. Por ahora tenemos un curso completo de R así que si eres un amante de R esto es para ti. En este momento estoy creando correctamente la contraparte Python, así que si quieres saber más sobre eso, por favor visita aquí .
Business-Science University te llevará a través de todo Proceso Data-Science-for-Business para resolver problemas con la ciencia de datos, utilizando el aprendizaje automático para crear aplicaciones interactivas y distribuir soluciones dentro de su organización.
Bio: Favio Vazquez es un físico e ingeniero informático que trabaja en Data Science y Computational Cosmology. Él tiene una pasión por la ciencia, la filosofía, la programación y la música. En este momento está trabajando en ciencia de datos, aprendizaje automático y Big Data como Principal Data Scientist en Oxxo. Además, es el creador de Ciencia y Datos, una publicación de Data Science en español. Le encantan los nuevos desafíos, trabajar con un buen equipo y tener problemas interesantes para resolver. Es parte de la colaboración de Apache Spark, ayuda en MLlib, Core y la documentación. Le encanta aplicar su conocimiento y experiencia en ciencia, análisis de datos, visualización y aprendizaje automático para ayudar a que el mundo se convierta en un lugar mejor.
Original . Repostado con permiso.
Relacionado: