Métadonnées, ontologies et linked data « pintiniblog

Métadonnées, ontologies et linked data

Comunicazione e ricerca semantica di contenuti informativi tra Metadati, Linked open Data e Ontologie

(source: Iryna Solodovnik in Bibliotime, XIV, 2, juillet 2011 – Communication et recherche sémantique de contenus informationnels entre métadonnées, linked open data et ontologies)

Les métadonnées dans le monde de l’information

Les métadonnées constituent actuellement les bases fondamentales du « nouveau » web en matière d’indexation, d’identification, de classification, d’authentification, de conservation, d’intégrité et de gestion des droits, de distribution, de recherche et de récupération des ressources numériques. Qu’elles soient descriptives, administratives, structurelles, elles contribuent à une gestion plus claire et modulaire des objets/collections numériques.

Le mapping des différents types de métadonnées, mené en parallèle, permet de plus en plus d’affronter la délicate question des équivalences sémantiques. L’analyse des applications qui se mettent en place permet d’identifier la granularité avec laquelle peuvent être traitées les ressources informationnelles.

Ces dernières années, des standards de métadonnées permettent de gérer la certification des contenus, leur représentation pour la recherche, la conservation à court, moyen et long terme de ces contenus: LOM (Learning Object Metadata), TEI (Text Encoding Initiative), PREMIS, etc.

L’utilisation de ces standards, de ces normes permet de créer à partir des métadonnées des conditions d’accès et de diffusion des informations de qualité et de plus en plus précises. La qualité des métadonnées peut être améliorée à travers un processus de normalisation qui prévoit l’utilisation de terminologies, de vocabulaires contrôlés, etc.

Le choix des schémas de métadonnées est primordial dans l’implémentation et le support des archives ouvertes/dépôts institutionnels-disciplinaires (cf. bien sûr OAI – Open Archives Initiative et OAI-PMH – Open Archives Initiative Protocol for Metadata Harvesting qui permet de récolter des données d’origines variées et de les chercher de manière intégrée).

Méta(données), linked (open) data et ontologies

Lors de la conférence WWW2011, le workshop consacré aux Linked Data on the Web a mis l’accent sur le web en tant qu’espace d’information global, constitué non seulement de documents liés, mais aussi de (méta)données liées. L’objectif est de créer des ensembles de données et de les relier directement à des ensembles existants, ce qui permet d’éviter des duplications de données inutiles et de maintenir une mise à jour de ces données efficace. Les linked data se basent  sur des standards du web tels que le protocole HTTP, bien sûr, les URIs (Uniform Resource Identifier), RDF (Resource Description Framework). Cf. les projets Open Definition et Open Data Commons. Ces ensembles de données reliées sont graphiquement représentés dans un LOD cloud diagram. Il s’agit d’une représentation possible, il en existe bien entendu d’autres.

-Réseau d’ontologies

Cette représentation repose sur le concept de « réseaux d’ontologies« , qui permettent de se mouvoir d’un ensemble de données conceptuel à un autre et de découvrir de nouveaux univers de contenus reliés à l’ensemble de départ. Exemple: imaginons a) un dépôt institutionnel, b) une plateforme de CVs, c) une base de données d’évaluation de la recherche scientifique: relier ces ensembles pourraient apporter une plus-value à l’ensemble des acteurs en présence.

LOD (Linking Open Data)

On l’a vu, afin de décrire le modèle sémantique d’un certain domaine, il faut: 1) s’accorder sur le choix d’un vocabulaire pour représenter explicitement les aspects conceptuels; 2) définir le profil des métadonnées et de leurs propriétés; 3) rendre explicite, à travers la syntaxe et le vocabulaire du ou des modèles de métadonnées, les classes et les propriétés de ces modèles; 4) normaliser et relier le domaine « naissant » à des domaines existants; 5) définir et décrire les cardinalités entre les classes de métadonnées avec RDF (et ses ontologies).

-LOD: applications pratiques

Belgique: projet Archipel (UGhent)

Finlande: projet FinnONTO (cf. DataFinland)

-LOD et données bibliographiques

Des données bibliographiques ouvertes, reliées et réutilisables? On y travaille:

Des travaux sont également en cours pour rendre explicites en RDF des standards comme MODS (Metadata Object Description Schema) ou le MARC:

Enfin, citons l’initiative de l’Open Knowledge Foundation, Open Bibliography Principles, la « déclaration de Berlin » en quelque sorte des données bibliographiques ouvertes.

Conclusion: libérer les connaissances

L’objectif pour les institutions productrices de connaissances est bien celui-là: diffuser librement et largement leurs savoirs. Le défi: comment les publier et les contextualiser sur le web, les relier à d’autres ensembles, les rendre facilement accessibles et, à long terme, augmenter de manière significative leur consultation/(ré)utlisation.

Voir la bibliographie ici

http://pintiniblog.wordpress.com/2011/09/10/metadonnees-linked-data-ontologies

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s