Crear datasets con Amazon SageMaker Ground Truth

La construcción de un conjunto de datos de entrenamiento de alta precisión para su algoritmo de aprendizaje automático (ML) es un proceso iterativo.

Es común revisar y ajustar continuamente sus etiquetas hasta que esté satisfecho de que las etiquetas representan con precisión la verdad fundamental, o lo que es directamente observable en el mundo real.

Los profesionales de ML a menudo construyen sistemas personalizados para revisar y actualizar las etiquetas de datos porque los datos etiquetados con precisión son críticos para la calidad del modelo de ML.

Si hay problemas con las etiquetas, el modelo de ML no puede conocer efectivamente la verdad básica, lo que lleva a predicciones inexactas.

Una forma en que los profesionales de ML han mejorado la precisión de sus datos etiquetados es mediante el uso de flujos de trabajo de auditoría.

Los flujos de trabajo de auditoría permiten a un grupo de revisores verificar la precisión de las etiquetas (un proceso llamado verificación de etiquetas) o ajustarlas (un proceso llamado ajuste de etiquetas) si es necesario.

Amazon SageMaker Ground Truth ahora presenta funciones incorporadas en flujos de trabajo para verificación de etiquetas y ajuste de etiquetas para cuadros delimitadores y segmentación semántica.

Con estos nuevos flujos de trabajo, puede encadenar un trabajo de etiquetado existente de Amazon SageMaker Ground Truth a un trabajo de verificación o ajuste, o puede importar sus etiquetas existentes para un trabajo de verificación o ajuste.

Esta publicación lo guía a través de ambas opciones para los cuadros delimitadores etiquetas. El tutorial supone que está familiarizado con la ejecución de un trabajo de etiquetado o que tiene etiquetas existentes.

Para obtener más información, consulte Amazon SageMarker Ground Truth: cree conjuntos de datos altamente precisos y reduzca los costos de etiquetado hasta en un 70% .

Encadenamiento de un trabajo de etiquetado completo de Amazon SageMaker Ground Truth

Para encadenar un etiquetado completo trabajo, complete los siguientes pasos.

  1. Desde la Consola de Amazon SageMaker Ground Truth elija Etiquetar trabajos .
  2. Seleccione el trabajo deseado.
  3. Desde el Menú desplegable Acciones elija Cadena .

La siguiente captura de pantalla muestra la página Etiquetado de trabajos :

Para obtener más información, consulte Encadenamiento de trabajos de etiquetado .

La página Descripción general del trabajo lleva adelante las configuraciones que utilizó para su trabajo encadenado. Si no hay cambios, puede pasar a la siguiente sección Tipo de tarea .

Configuración de verificación de etiqueta

Para usar la verificación de etiqueta, desde Tipo de tarea elija Verificación de etiqueta .

Consulte la siguiente captura de pantalla de la página Tipo de tarea :

La sección Trabajadores está preconfigurada para las selecciones que realizó para el trabajo de etiquetado encadenado. Puede optar por elegir una fuerza de trabajo diferente o seguir con las mismas configuraciones para su trabajo de verificación de etiquetas. Para obtener más información, consulte Administración de su fuerza laboral .

Puede definir sus etiquetas de verificación, por ejemplo, Etiqueta correcta Etiqueta incorrecta - Objeto (s) perdido (s) y Etiqueta incorrecta - Casillas no dibujadas con precisión .

También puede especificar las instrucciones en el panel izquierdo para guiar a los revisores sobre cómo verificar las etiquetas.

Consulte el siguiente captura de pantalla de la página Herramienta de verificación de etiquetas página:

Configuración del ajuste de etiquetas

Para realizar el ajuste de etiquetas, desde la sección Tarea tipo elija Cuadro delimitador . Consulte la siguiente captura de pantalla de la página Tipo de tarea :

Los siguientes pasos para configurar la sección Trabajadores y configurar la herramienta de etiquetado son similares a la creación de una trabajo de verificación La única excepción es que debe optar por mostrar las etiquetas existentes en la sección Opciones de visualización de etiquetas existentes . Consulte la siguiente captura de pantalla:

Carga de sus etiquetas existentes desde fuera de Amazon SageMaker Ground Truth

Si etiquetó sus datos fuera de Amazon SageMaker Ground Truth aún puede usar el servicio para verificar o ajustar sus etiquetas. Importe sus etiquetas existentes siguiendo estos pasos.

  1. Cree un manifiesto aumentado con sus datos y etiquetas existentes. Por ejemplo, en el siguiente código de ejemplo, la fuente-referencia apunta a las imágenes que fueron etiquetadas , y el atributo “recuadro encuadernado” es la etiqueta.
     {"source-ref": "", "recuadro encuadernado": }
    {"source-ref": "", "recuadro encuadernado": } 
  2. Guarde su manifiesto aumentado en Amazon S3 . Debe guardar el manifiesto en el mismo depósito S3 que sus imágenes. Además, recuerde el nombre del atributo de sus etiquetas (en esta publicación, box-box ) porque necesita señalar esto cuando configure sus trabajos. Además, asegúrese de que las etiquetas se ajusten al formato de etiqueta prescrito por Amazon SageMaker Ground Truth. Por ejemplo, puede ver el formato de etiqueta para los cuadros delimitadores en Salida del trabajo del cuadro delimitador . Ahora está listo para crear trabajos de verificación y ajuste.
  3. Desde la consola de Amazon SageMaker Ground Truth, cree un nuevo etiquetado
  4. En Descripción general del trabajo para Ubicación del conjunto de datos de entrada señale la ruta S3 del manifiesto aumentado que creó. Consulte la siguiente captura de pantalla de la Descripción general del trabajo página:
  5. Siga los pasos descritos anteriormente para configurar Tipo de tarea Trabajadores y la herramienta de etiquetado al configurar su trabajo de verificación o ajuste. [19659008] En Opción de visualización de etiquetas existentes para Nombre del atributo de etiqueta seleccione el nombre de su manifiesto aumentado en el menú desplegable. Consulte la siguiente captura de pantalla de Etiquetas existentes opciones de visualización :

Conclusión

Una muy precisa el conjunto de datos de capacitación es crítico para lograr sus iniciativas de aprendizaje automático, y ahora tiene flujos de trabajo integrados para realizar la verificación y el ajuste de etiquetas a través de Amazon SageMaker Ground Truth.

Esta publicación lo guió a través de cómo usar las nuevas funciones de verificación y ajuste de etiquetas. Puede encadenar un trabajo de etiquetado completado o puede cargar etiquetas. Para comenzar, visite la consola de Amazon SageMaker Ground Truth .

Dejá un comentario