Les technologies du Web Sémantique et de l'extraction d'information

WebSem
Abstract

Le Web sémantique désigne un ensemble de technologies visant à rendre le contenu des ressources du World Wide Web accessible et utilisable par les programmes et agents logiciels, grâce à un système de métadonnées formelles, utilisant notamment une famille de langages développés par le W3C. Ce cours est une visite guidée d'un certain nombre de recommandations du W3C permettant de représenter (RDF/S, SKOS, OWL) et d'interroger (SPARQL) des connaissances sur le web ainsi que les formalismes logiques sous-jacents à ces langages, leur syntaxe et leur sémantique formelle. Nous aborderons également les problèmes posés par la construction de systèmes à base de connaissances et de leur mise sur le réseau (alignement). Nous montrerons finalement comment extraire de la connaissance à partir de textes en utilisant des techniques de traitement de la langue naturelle.

Modalités pédagogiques : Cours magistraux et séances de travaux pratiques (groupe de 2 étudiants maximum)

Règles du cours : La participation aux séances de travaux pratique est obligatoire.

Bibliography

Requirements

Connaissances basiques des technologies du web (html, css, javascript) ou des bases de données est un plus

Description

Ce cours est une visite guidée d'un certain nombre de recommandations du W3C permettant de représenter (RDF/S, SKOS, OWL) et d'interroger (SPARQL) des connaissances sur le web ainsi que les formalismes logiques sous-jacents à ces langages, leur syntaxe et leur sémantique formelle. Nous aborderons également les problèmes posés par la construction de systèmes à base de connaissances et de leur mise sur le réseau (alignement). Nous montrerons finalement comment extraire de la connaissance à partir de textes en utilisant des techniques de traitement de la langue naturelle.

Objectifs d'apprentissage:

  • Maîtriser la pile des technologies du web sémantique

    • RDF: représenter de la connaissance sur le web
    • RDFS, SKOS, OWL: développer ses propres vocabulaires
    • SPARQL: interroger le web de données
  • Extraction d'Information 101

    • Reconnaissance et désambigüisation d'entités nommées
    • Analyse de sentiment
  • Développer des applications sur le web sémantique

    • Les principes des données liées: des données brutes maintenant !
    • Réconcilier des données sur le web en utilisant des techniques d'apprentissage
    • Interagir avec le web de données : RDFa, microdata, JSON-LD

Nb d'heures : 21.00

Evaluation :

  • Rapports de travaux pratiques 1+2+3 (40% de la note finale),
  • Examen Final (60% de la note finale)