Blog sobre las tecnologías más utilizadas del momento como: Big Data, Machine Learning e IA, además de las herramientas de programación y bibliotecas de Python, Tensorflow, Scykit-learn entre muchos otros!.
Este artículo es para dar una breve introducción sobre Hadoop para aquellos que no saben casi nada sobre esta tecnología. Big Data está en la base de todas las megatendencias que están sucediendo hoy en día, desde las redes sociales hasta la nube, los dispositivos móviles y los juegos. Este artículo ayudará a construir la
Hola a todos, hoy vamos a hablar sobre detalles básicos de apache pig. Una curiosidad, si buscas en google.. pig, apache pig o sus variaciones… verás que el logo es un chancho/puerco que se parece bastante a porky de los looney tunes… En fin, mencionando este pequeño detalle (que no aporta nada..) vamos a lo que
apache hive es una solución de almacenamiento de datos construida encima de Hadoop y proporciona lenguaje de consulta SQL del mismo nombre: HiveQL. Que requiere HiveQL?, en principio una curva de aprendizaje mínima para las personas con conocimientos de SQL, por lo que los analistas de datos son público objetivo para desarrollar tareas relacionadas con