Glossaire

De Wiki du pôle Humanités numériques
Aller à : navigation, rechercher

Glossaire du web sémantique ou web de données

D

* DOI (Digital Object Identifier)

Le DOI (Digital Object Identifier ou identifiant d'objet numérique) est une méthode standardisée pour l'identification permanente d'un objet électronique publié, un genre de code permanent des articles scientifiques.

Il est parfois comparé aux ISSN ou ISBN pour le web, mais c'est aussi une alternative à l’instabilité des URL par l’association de la localisation du document et des métadonnées qui lui sont liées.

Un DOI unique est attribué à chaque ressource et ne sera pas réutilisé. Il est établi en enregistrant des métadonnées liées à la ressource numérique. L'attribution et la gestion des DOI est sous la responsabilité d'agences externes internationales, un lien utilisant un DOI est donc le lien le plus stable qui soit : même si une revue change d'éditeur (et donc de site Web), son DOI demeurera le même. Le DOI étant court et stable, il répond aux problèmes de transmission de liens morts ou de liens trop longs. Pour ces raisons, de plus en plus de styles de présentation bibliographique demandent maintenant de mettre non pas l'URL d'un article dans la référence, mais plutôt d'en indiquer le DOI.

Comme les URL, les DOI sont des codes structurés qui débutent par le chiffre 10 suivi par le code de l’organisation responsable de la diffusion de la ressource (pour nous le SCD), puis l’identifiant du document. Par exemple, le DOI de la notice sur la site de Poreč dans l'Atlas de l'adriatique antique est 10.21412/adriatlas_77 .
Les DOI doivent être intégrés aux références de citation des objets sur internet en fin de références bibliographiques notamment,
par ex. DOI : 10.21412/adriatlas_77

Il existe plusieurs “DOI resolver”, dont le rôle est équivalent à celui des moteurs de recherche, à la différence qu’ils permettent de retrouver directement la ressource correspondante. Pour accéder à la version en ligne d'un article à partir de son DOI, il suffit de taper dans un navigateur l'adresse http://dx.doi.org/ suivie du DOI . Vous serez automatiquement dirigé vers l'article sur la page Web de son éditeur. Le site http://www.crossref.org propose le même service.

L

  • LOD (Linked Open Data)

Linked Data - Connect Distributed Data across the Web

(ou données ouvertes et liées DOL pour les francophones)

Le site Linkedata.org précise : "Linked Data is about using the Web to connect related data that wasn't previously linked, or using the Web to lower the barriers to linking data currently linked using other methods.

Wikipedia définit le Linked Data ou Web des données comme une initiative du W3C (Consortium World Wide Web) visant à favoriser la publication de données structurées sur le Web, non pas sous la forme de silos de données isolés les uns des autres, mais en les reliant entre elles pour constituer un réseau global d'informations.

Linking Open Data cloud diagram 2014, by Max Schmachtenberg, Christian Bizer, Anja Jentzsch and Richard Cyganiak. http://lod-cloud.net/

W

  • Web sémantique

Le Web de données s’appuie sur la fonction primaire du Web « classique » : un moyen de publier et de consulter des documents. Mais les documents sont enrichis de données formalisées (les métadonnées) pour être traitées automatiquement. L’objectif majeur étant de faire évoluer le web vers un espace constitué de données accessibles, structurées, dans un format non-propriétaire, identifiées et liées entre elles.

Le Web sémantique est entièrement fondé sur le Web et ne remet pas en cause ce dernier. Le Web sémantique se base donc sur la fonction basique du Web " classique " : un moyen de publier et consulter des documents. Mais les documents traités par le Web sémantique contiennent non pas des textes en langage naturel (français, espagnol, chinois, etc.) mais des informations formalisées pour être traitées automatiquement. Ces documents sont générés, traités, échangés par des logiciels. Ces logiciels permettent souvent, sans connaissance informatique, de :

générer des données sémantiques à partir de la saisie d'information par les utilisateurs ; agréger des données sémantiques afin d'être publiées ou traitées ; publier des données sémantiques avec une mise en forme personnalisée ou spécialisée ; échanger automatiquement des données en fonction de leurs relations sémantiques ;

générer des données sémantiques automatiquement, sans saisie humaine, à partir de règles d'inférences.