Un graphe de connaissance est une représentation de connaissances relatives à un domaine sous une forme exploitable par la machine.
La représentation des connaissances sous forme d’un graphe est un élément clé pour la recherche efficace et contextuelle d’informations et connaissances riches, la prise de décision, les applications d’intelligence artificielle, les assistants vocaux…
Le graphe de connaissance est formé de trois composants : une ontologie (modèle de données), des
référentiels ou vocabulaires contrôlés et les ressources couvertes par la graphe.
Les points forts des graphes de connaissance
- des données facilement accessibles et compréhensibles car organisées selon des vues métiers,
- des données pérennes et stables au service d’applications de traitement et de diffusion de l’information,
- des ressources directement exploitables par les outils d’intelligence artificielle et de raisonnement logique,
- des données de qualité grâce à une gamme d’outils automatisés, intelligents, dédiés au contrôle de la qualité et à la complétude du graphe,
- une grande facilité d’enrichissement du graphe de connaissance avec des impacts mineures sur les applications qui l’utilisent déjà,
- des coûts de mise en oeuvre et de maintenance significativement plus bas que sur des bases de données relationnelles,
- la gestion native du multilinguisme,
- une interopérabilité des données favorisées par la gestion d’identifiants stables, l’alignement avec des ressources externes, la mise en oeuvre de référentiels partagés,
- un environnement et des standards construits nativement sur les standards du web.
Couverture
d’un graphe de connaissance
Dans le cadre d’un projet, il n’est pas toujours simple de définir la couverture d’un graphe de connaissance, doit-il décrire tous les détails possibles ? Doit il être le plus simple possible ?
Une méthode efficace et sûre est de collecter auprès des futurs utilisateurs toutes les questions auxquelles le graphe devra répondre, puis de construire l’ontologie et alimenter le graphe pour pouvoir répondre à ce type de questions, pas plus, pas moins.
Les graphes de connaissances sont simples à enrichir. Il est toujours temps d’enrichir l’ontologie, les vocabulaires contrôlés et les connaissance en fonction des besoins concrets des utilisateurs.
Ontologie
La modélisation des connaissances dans le graphe est définie par son ontologie (modèle de données). L’ontologie définit les classes des ressources (personnes, oeuvres, lieux, événements….), leurs propriétés (nom, date de naissance, date de création, description textuelle…) et les relations qu’elles entretiennent (créé par, intègre, effectué par…). L’ontologiste dispose pour son travail d’une série d’ontologies de base qui décrivent des modélisations régulièrement utilisées : modélisations d’un événement, d’un document, d’une oeuvre, d’une organisation, d’une personne, d’un référentiel, du temps, des positions géographiques….
Pour réaliser l’ontologie du graphe on pourra agréger ces ontologies de base et ajouter les éléments manquants. On pourra aussi concevoir une ontologie en s’inspirant de ces ontologies de base.
En fonction des besoins d’enrichissement du graphe on ajoutera de nouvelles classes de ressources, de nouvelles relations et propriétés.
Vocabulaires contrôlés
Le graphe de connaissance repose sur une collection de vocabulaires contrôlés (référentiels) qui permettent d’identifier les concepts utilisés pour décrire les ressources (par exemple : les genres musicaux, les types de machine, les types de textes de loi, les rôles des personnes dans une organisation, une liste de pays, une liste de langues…). La création de ces vocabulaires contrôlés est une des étapes de la mise en place d’un graphe de connaissance.
Alimentation
du graphe de connaissance
Les informations qui alimentent le graphe de connaissance peuvent venir de sources très diverses : de base de données relationnelles, de documents XML, de connaissances extraites de textes ou d’images, de saisies manuelles, d’autres graphes de connaissance…
Un point fort du graphe de connaissance est sa capacité à intégrer et relier des données hétérogènes provenant de sources multiples.
Pour mettre en place un processus d’alimentation automatisée, on réalise un alignement entre la description des ressources à intégrer et l’ontologie du graphe de connaissance, puis on met en place les traitements d’extraction, conversion et alimentation du graphe.
Raisonnement
Le graphe de connaissance est conçu pour le raisonnement. Les raisonnements peuvent s’appuyer sur les règles définies dans l’ontologie ou sur un ensemble de règles métiers gérées séparément.
Le raisonnement est utilisée pour inférer de nouvelles connaissances à partir des connaissances du graphe, pour compléter des données externes avec les connaissances du graphe, pour contrôler automatiquement et de manière continue la cohérence et la complétude du graphe de connaissance.
Le graphe de connaissance
au service des applications,
une approche « centrée donnée »
La mise en place d’un graphe de connaissance fait partie d’une stratégie d’organisation « centrée donnée” dans laquelle des connaissances agrégées et exploitables par la machine deviennent le socle de nombreuses applications et services comme par exemple :
- la publication de sites web pour chercher et naviguer dans les connaissances et contenus associés,
- l’enrichissement d’un outil de recherche et de navigation afin de lui fournir du contexte et des connaissances,
- la mise en oeuvre d’assistants vocaux et chatbots capables de dialoguer avec les utilisateurs,
- l’annotation sémantique de nouveaux contenus en s’appuyant sur les connaissances du graphe,
- l’enrichissement d’applications existantes avec les données d’une base de connaissance spécialisée,
- l’alimentation d’application d’IA avec des données d’apprentissage,
- …
Chaque graphe de connaissance devient le centre d’un éco-système d’applications.