Objectif

Fournir un query store permettant la mise en place de la citation fine des jeux de données.

Présentation détaillée

La RDA a défini la notion de query store afin de mettre en place la citation fine des données. Cette notion a également été reprise dans les recommandations du groupe Interpoles relatives aux DOI.

Qu’est ce qu’un Query store ?

Lorsqu’un utilisateur exporte un jeu de données, il ne va souvent ne crécupérer qu’une partie de ses données. Il va par exemple sélectionner une période de temps particulière ou une zone géographique. Ce filtre d’extraction appliqué sur un jeu de données est appelé query. Il peut varier d’un jeux de données à l’autre. Il peut également varier dans le temps étant donné que des fonctionnalités de filtre peuvent avoir été mise en place ultérieurement.

Un query store est une application qui stocke, de manière centralisée, des query. A chacune d’elle, le query store affecte un queryId, identifiant court (ex: 1,2,3…).

Ainsi, l’extraction effectuée par l’utilisateur devient identifiable précisément en combinant DOI du jeu de données et queryId sous la forme DOI#queryId. Cette approche est celle de la citation dynamique des données (également nommée DOI à fragments). Lors de la résolution d’un DOI, l’éventuel queryId est transmis à la landing page. Celle-ci à alors la responsabilité de modifier son affichage en fonction du queryId. Pour ce faire elle va interroger le query store pour retrouver les caractéristiques de la query. Grace à ses informations, elle pourra par exemple rappeler le filtre appliqué ou encore proposer d’extraire à nouveau les données.

Il est important de comprendre que le query store ne stocke pas les données extraites mais uniquement le filtre appliqué sur celles-ci.

Offre du SEDOO

Le SEDOO propose une offre générique de query store qui permet à tous les projets de:

  • Stocker de manière pérenne un document JSON regroupant les informations d’une requête d’extraction de données et obtenir une clé unique associée.
  • Permettre des fonctions de lecture et de suppression du document en fonction de la clé

Qui peut utiliser l’offre ?

L’offre est ouverte:

  • à tous les projets gérés par le SEDOO
  • à toute personne disposant d’une clé applicative fournie par le SEDOO

.

Dans les deux cas, elle n’est pas limitée en terme de nombre de requêtes à stocker.

L’attribution d’une clé applicative se fait pour le moment via le formulaire suivant

Engagements du SEDOO

Le SEDOO assure les engagements suivants:

  • Fonctionnement correct du service Web .Ce fonctionnement est vérifié régulièrement.
  • Mise à disposition d’une API REST sécurisé permettant la gestion des query
  • Sauvegarde pérenne des query. Cette sauvegarde est effectuée sur AWS/S3. (à développer)
  • Statistiques d’utilisation des query (à développer)

Engagements des utilisateurs

  • Les utilisateurs de cette offre de service s’engagent à supprimer les requêtes inutiles (ex: requêtes de test).
  • Les utilisateurs de cette offre de service acceptent la suppression automatique des requêtes n’ayant pas été interrogées depuis 10 ans.

Porteur de l’offre

Cette offre est portée par le SEDOO.

Statistiques

A développer

Crédits photo

unsplash-logoRidham Parikh