Des données tabulaires aux graphes de connaissances : Etat de l'art des méthodes d'interprétation sémantique de tables

Liu, Jixiong; Huynh, Viet-Phi; Chabot, Yoan; Troncy, Raphaël
IC 2023, 34èmes Journées Francophones en Ingénierie des Connaissances, 3-7 July 2023, Strasbourg, France

Nominé à la distinction article mis en lumière

Les données tabulaires sont omniprésentes sur le Web et dans les entrepôts de données des entreprises. Ces tableaux contiennent des informations pouvant potentiellement devenir des connaissances après une étape d’interprétation sémantique de tables se basant sur un graphe de connaissances. Ce papier propose un état de l’art des différentes tâches et méthodes existantes pour mener à bien cette interprétation. Dans un premier temps, nous proposons une nouvelle classification des tableaux reflétant la diversité et la complexité de ces structures. Nous décomposons ensuite le problème de l’interprétation sémantique en cinq soustâches et passons en revue trois familles d’approches au travers du prisme des corpus d’évaluation proposés par la communauté. 


HAL
Type:
Conference
City:
Strasbourg
Date:
2023-07-03
Department:
Data Science
Eurecom Ref:
7353
Copyright:
© EURECOM. Personal use of this material is permitted. The definitive version of this paper was published in IC 2023, 34èmes Journées Francophones en Ingénierie des Connaissances, 3-7 July 2023, Strasbourg, France and is available at :

PERMALINK : https://www.eurecom.fr/publication/7353