Ecole d'ingénieur et centre de recherche en Sciences du numérique

Introduction aux technologies du Web Sémantique

[WebSem]
T Enseignement Technique


Résumé

Le Web sémantique désigne un ensemble de technologies visant à rendre le contenu des ressources du World Wide Web accessible et utilisable par les programmes et agents logiciels, grâce à un système de métadonnées formelles, utilisant notamment une famille de langages développés par le W3C. Ce cours est une visite guidée d'un certain nombre de recommandations du W3C permettant de représenter (RDF/S, SKOS, OWL) et d'interroger (SPARQL) des connaissances sur le web ainsi que les formalismes logiques sous-jacents à ces langages, leur syntaxe et leur sémantique formelle. Nous aborderons également les problèmes posés par la construction de systèmes à base de connaissances et de leur mise sur le réseau (alignement). Nous montrerons finalement comment extraire de la connaissance à partir de textes en utilisant des techniques de traitement de la langue naturelle.

Enseignements et méthodes d'apprentissage: Cours magistraux et TPs (groupe de 2 étudiants maximum)

Règles du cours: La participation aux TPs est obligatoire.

Bibliographie

·         Grigoris Antoniou and Frank van Harmelen: A Semantic Web Primer. 2nd Edition, MIT Press, 2009. http://www.semanticwebprimer.org/

·         Dean Allemang and Jim Hendler: Semantic Web for the Working Ontologist. 1st Edition, Morgan Kaufmann, 2008. http://workingontologist.org/

·         Jeffrey T. Pollock. Semantic Web for Dummies. http://www.semanticwebfordummies.com/

·         John G. Breslin, Alexandre Passant and Stefan Decker. The Social Semantic Web, Springer Verlag, 2009. http://socialsemanticweb.net/

Préalable Requis

Connaissance basique des technologies du web (html, css, javascript) ou des bases de données est un plus

Description

:Résultats d'apprentissage:

·         Maîtriser la pile des technologies du web sémantique

o   RDF: représenter de la connaissance sur le web

o   RDFS, SKOS, OWL: développer ses propres vocabulaires

o   SPARQL: interroger le web de données

·         Extraction d'Information 101

o   Reconnaissance et désambigüisation d'entités nommées

o   Analyse de sentiment

·         Développer des applications sur le web sémantique

o   Les principes des données liées: des données brutes maintenant !

o   Réconcilier des données sur le web en utilisant des techniques d'apprentissage

o   Interagir avec le web de données : RDFa, microdata, JSON-LD

Nb heures: 21.00

Evaluation:  TP 1+2+3 (40%), Examen Final (60%)

Nombre d'heures: 21.00