Gráfico de conocimiento en machine learning: Introducción
En los últimos artículos de la serie:
He estado hablando sobre el tejido de datos en general y sobre algunos conceptos de aprendizaje automático y aprendizaje profundo en el tejido de datos.
Y también brinde mi definición del tejido de datos:
El tejido de datos es la plataforma que soporta todos los datos de la empresa. Cómo se gestiona, describe, combina y accede universalmente. Esta plataforma se forma a partir de un Enterprise Knowledge Graph para crear un entorno de datos uniforme y unificado.
Si observa la definición dice que la estructura de datos se forma a partir de una Enterprise Knowledge Graph. Por lo tanto es mejor que sepamos cómo crearlo y administrarlo.
Objetivos
General
Establecer la base de la teoría de los gráficos de conocimiento y la construcción.
Específicos
- Explicar los conceptos de los gráficos de conocimiento relacionados con las empresas.
- Dé alguna recomendación sobre cómo construir un gráfico de conocimiento en machine learning empresarial exitosa.
- Muestra ejemplos de gráficos de conocimiento.
Teoría principal
La tela en el tejido de datos se construye a partir de un gráfico de conocimiento en machine learning.
Para crear una gráfica de conocimiento que necesita semántica y ontologías para encontrar una manera útil de vincular sus datos que identifican y conectan de forma única los datos con términos comerciales comunes.
Sección 1. ¿Qué es un gráfico de conocimiento en machine learning?
El gráfico de conocimiento en machine learning consiste en colecciones integradas de datos e información. Que también contiene un gran número de enlaces entre diferentes datos.
La clave aquí es que, en lugar de buscar posibles respuestas bajo este nuevo modelo buscamos una respuesta.
Queremos los hechos, de dónde provienen esos hechos es menos importante. Los datos aquí pueden representar conceptos, objetos, cosas, personas y, en realidad, lo que tenga en mente. El gráfico llena las relaciones, las conexiones entre los conceptos.
En este contexto, podemos hacer esta pregunta a nuestro lago de datos:
¿Qué existe aquí?
Estamos en una situación diferente aquí. Una en la que es posible establecer un marco para estudiar los datos y su relación con otros datos.
En un gráfico de conocimiento la información representada en una ontología formal particular puede ser más fácilmente accesible al procesamiento automatizado de la información.
Y la mejor manera de hacerlo es un área activa de investigación en ciencias de la computación como la ciencia de datos.
Todas las declaraciones de modelado de datos (junto con todo lo demás) en lenguajes ontológicos y el mundo de los gráficos de conocimiento para datos son incrementales, por su propia naturaleza.
La mejora o modificación de un modelo de datos después del hecho se puede lograr fácilmente modificando el concepto.
Con un gráfico de conocimiento, lo que estamos construyendo es una representación de datos legibles por el ser humano que identifican y conectan los datos con términos comerciales comunes.
Esta “capa” ayuda a los usuarios finales a acceder a los datos de forma autónoma segura y con confianza.
¿Recuerdas esta imagen?
Propuse antes que las ideas en el tejido de datos pueden ser una idea que se puede considerar como una abolladura. Y el proceso automático de descubrir cuál es esa idea es el aprendizaje automático.
¿Pero qué es este tejido ?
Es el objeto formado por el conocimiento-grafo. Al igual que en la teoría de la relatividad de Einstein. Donde el tejido está hecho por el continuo (¿ o discreto? ) del espacio-tiempo. Aquí el tejido se crea cuando se crea un gráfico de conocimiento.
Para construir el conocimiento gráfico que necesita datos vinculados. El objetivo de los datos vinculados es publicar datos estructurados de manera que puedan ser fácilmente consumidos y combinados con otros datos vinculados. Y las ontologías como la forma en que podemos conectar entidades y comprender sus relaciones.
Sección 2. Crear una gráfico de conocimiento en machine learning empresarial exitoso
Hace un tiempo Sebastien Dery escribió un interesante artículo sobre los desafíos de los gráficos de conocimiento. Aquí puede echar un vistazo:
Challenges of Knowledge Graphs
From Strings to Things – An Introduction medium.com
Y del gran blog en cambridgesemantis. com
Y más recursos, uno de los conceptos que ni siquiera menciono en ningún artículo pero es muy importante. Es el concepto de triples: sujeto, objeto y predicado (o entidad-valor-atributo ).
Comúnmente, cuando estudias estos tres, en realidad se refieren al Marco de Descripción de Recursos (RDF, por sus siglas en inglés).
RDF es una de las tres tecnologías fundamentales de la Web Semántica. Las otras dos son SPARQL y OWL. RDF es el modelo de datos de la Web semántica.
NOTA: Oh, por cierto, casi todos estos conceptos vinieron con la nueva definición de semántica para la red mundial. Pero la usaremos para los gráficos de conocimiento en general.
No voy a dar una descripción completa del marco aquí. Pero te daré un ejemplo de cómo funcionan. Recuerda que estoy haciendo esto porque es la forma en que comenzamos a construir ontologías, vinculando datos y la gráfica de conocimiento.
Veamos un ejemplo para ver qué son estos triples. Esto está estrechamente relacionado con el ejemplo de Sebastien.
Comenzaremos con la cadena “geoffrey hinton”.
Aquí tenemos una cadena simple que representa el primer borde, lo que quiero saber.
Ahora, para comenzar a construir un principio de conocimiento. El sistema reconoce la cadena que realmente corresponde a la persona Geoffrey Hinton. Y luego reconocerá las entidades relacionadas con esa persona.
Luego tenemos algunas entidades que están relacionadas con Geoffrey pero todavía no sabemos qué son.
Por cierto, este es Geoffrey Hinton si no lo conoces:
Y luego el sistema comenzará a dar nombres a las relaciones:
Ahora hemos nombrado las relaciones donde sabemos de qué tipo de conexión que tenemos para nuestra entidad principal.
Este sistema puede ir por un tiempo encontrando conexiones de conexiones y creando así un gráfico enorme que representa las diferentes relaciones para nuestra “cadena de búsqueda”.
Para hacer esto el gráfico de conocimiento utiliza los triples así:
Para tener un triple necesitamos un sujeto, un objeto y un predicado que vincula los dos.
Entonces, como pueden ver, tenemos el sujeto relacionado con el objeto por el predicado. Esto puede parecer fácil para nosotros, los humanos. Pero necesita un marco muy completo para hacer esto con las máquinas.
Esta es la forma en que se forma el gráfico de conocimiento y cómo vinculamos los datos mediante ontologías y semánticas.
Entonces ¿Qué necesitamos crear un gráfico de conocimiento en machine learning exitoso? Partha Sarathi de Cambridge Semantics escribió un gran blog sobre eso.
Puede leerlo aquí:
Y para resumir necesitamos:
- Personas que lo imaginan:
Necesitas personas con la intersección de algún tipo de experiencia y tecnología en temas críticos para el negocio.
- Diversidad de datos y probablemente un gran volumen de la misma:
El valor y la escala de la adopción de un Enterprise Knowledge Graph son directamente proporcionales a la diversidad de datos que abarca.
- Un buen producto para construirlo:
El gráfico de conocimiento en machine learning debe ser, entre otros, bien gobernado, seguro, fácilmente conectable a los sistemas ascendente y descendente. Analizable a escala y más a menudo que no, amigable con la nube.
Por lo tanto el producto utilizado para crear un Enterprise Knowledge Graph moderno debe optimizarse para la automatización.
Admitir conectores para una amplia gama de sistemas de entrada. Ofrecer salida de datos basada en estándares a sistemas posteriores. Hacer que cualquier volumen de sus datos sea analizable rápidamente y hacer que la gobernabilidad fácil de usar.
Puede leer más aquí:
Sección 3. Ejemplos de gráfico de conocimiento en machine learning
Google:
Google es básicamente un gran conocimiento (con más adiciones) gráfico y crearon tal vez el mayor tejido de datos que hay sobre eso.
Tiene miles de millones de datos que incluyen información y relaciones entre millones de objetos. Y nos permite buscar a través de su sistema para descubrir ideas dentro de él.
Aquí puede obtener más información:
LinkedIn:
Mi red social favorita LinkedIn tiene una enorme base de conocimiento basada en “entidades” en LinkedIn. Como miembros, trabajos, títulos, habilidades, empresas, ubicaciones geográficas, escuelas, etc. Estas entidades y las relaciones entre ellas forman la ontología del mundo profesional.
Las perspectivas ayudan a los líderes y las ventas a tomar decisiones comerciales. Y aumentan el compromiso de los miembros con LinkedIn:
Recuerde que el conocimiento de LinkedIn (y casi todos) necesita escalar como nuevo registro de miembros. Se publican nuevos empleos, aparecen nuevas compañías, habilidades y títulos en los perfiles de miembros y descripciones de puestos, etc.
Puede leer más aquí:
Gráfico de conocimiento en machine learning para instituciones financieras:
Modelo conceptual para armonizar datos de diversas fuentes y crear conjuntos de datos gobernados para el caso de uso comercial consumo.
En este artículo por Marty Loughlin mostró un ejemplo de lo que la plataforma Anzo puede hacer por un banco. Y puede ver que esta tecnología no solo está relacionada con motores de búsqueda y trabaja con datos dispares.
Allí muestra cómo un gráfico de conocimiento en machine learning puede ayudar a este tipo de instituciones con:
- Datos alternativos para análisis y aprendizaje automático
- Análisis de riesgo de swap de tasa de interés
- Vigilancia comercial
- Fraude Analytics
- Característica de ingeniería y selección
- Migración de datos
y más. Ve a echar un vistazo.
Conclusión
Para crear una gráfica de conocimiento, necesita semántica y ontologías para encontrar una manera útil de vincular sus datos que identifique y conecte datos de manera única con términos comerciales comunes.
Cuando construimos una gráfica de conocimiento necesitamos formar triples para vincular los datos mediante ontologías y semánticas.
Además, la fabricación del gráfico de conocimiento en machine learning depende básicamente de tres cosas: personas que lo imaginaron, diversidad de datos y un buen producto para construirlo.
Hay muchos ejemplos de gráfico de conocimiento en machine learning a nuestro alrededor que ni siquiera sabemos.
Las empresas más exitosas del mundo están implementando y migrando sus sistemas para construir un tejido de datos y, por supuesto, todas las cosas que contiene.