Google Cloud Dataprep facilita preparación de datos ML

0
Google Cloud Dataprep
Uno de los desafíos que enfrentan los científicos de datos cuando ejecutan cargas de trabajo de aprendizaje automático. Es el procesamiento de la información antes de que esté listo para su uso. Google dio a conocer un nuevo servicio en la nube el jueves para aliviar ese problema.

Google Cloud Dataprep detectará automáticamente los esquemas de datos, combinaciones y anomalías

Como valores perdidos o duplicados, sin necesidad de codificación. Después de eso, ayudará a los usuarios a construir un conjunto de reglas para procesar la información.

Esas reglas luego se incorporan en formato Apache Streams. Y se pueden importar a productos como el Cloud Dataflow de Google para procesar la información que se importa a servicios como el servicio de almacenamiento de datos BigQuery.

Si bien Google Cloud Dataprep está diseñado para preparar datos para el aprendizaje automático. El sistema también utiliza el aprendizaje automático para tratar de determinar qué reglas serán más útiles para los clientes. A partir del jueves, está disponible en beta privada.

BigQuery también está recibiendo una serie de mejoras, incluido un nuevo programa de conjuntos de datos comerciales que ahora está disponible en la versión beta pública.

Permitirá a los usuarios obtener información de AccuWeather, Dow Jones, Xignite, HouseCanary y Remine y enviarla directamente a BigQuery para su posterior procesamiento.

BigQuery ahora también puede consultar datos almacenados en Cloud Bigtable

La base de datos NoSQL administrada de Google para datos de baja latencia. Eso significa que los usuarios pueden escribir una consulta SQL que puede acceder a la información de Bigtable y BigQuery. En el pasado, tendrían que escribir un programa para buscar Bigtable.

Los clientes de publicidad podrán enviar datos de Google Adwords, DoubleClick Campaign Manager, DoubleClick for Publishers y YouTube a BigQuery para su uso posterior en analíticas y otras aplicaciones de big data.

Esa característica puede ayudar a alentar a la flota de clientes publicitarios de la compañía a probar Google Cloud mientras se enfrenta a Amazon y Microsoft.

Hablando de noticias de la base de datos, la compañía anunció que su base de datos administrada en la nube Cloud ahora ofrece soporte beta para PostgreSQL además de MySQL.

Todas las noticias se anunciaron como parte de Google Cloud Next. La conferencia de usuarios de la empresa para empresas y empresas que se realiza en San Francisco.

Los anuncios vienen junto con otras noticias sobre la plataforma en la nube de la compañía. Que incluyen cambios en los precios y soporte para tiempos de ejecución personalizados en AppEngine.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *