Conditions pour les fournisseurs de données
Version 1.0
Le partage de données par l’entremise du graphe de connaissances Artsdata implique un grand nombre de processus de transformation, d’enrichissement et de mise en valeur des données. Ces processus sont pour la plupart invisibles aux contributeurs de données mais il sont néanmoins essentiels pour réaliser tous les avantages potentiels des données ouvertes et liées. Cette page fournit un aperçu de principaux processus appelés d’extraction-transformation-chargement (ETC).
Le Contributeur qui accepte de fournir des données au graphe de connaissance Artsdata autorise le personnel d’Artsdata1 à procéder aux activités d’extraction-transformation-chargement (ETC) des données suivantes :
- Extraire les données avec l’option technologique la plus appropriée selon les circonstances du Contributeur (voir la liste des techniques d’extraction).
- Transformer ces données au format RDF conformément au modèle de données Artsdata (lequel est 100% conforme aux recommandations de Google) ;
- Entreposer les données ainsi extraites et transformées dans une instance de base de données graphe dédiée aux données du Contributeur (ci-après appelé le « graphe source ») et répertoriée dans la liste des fournisseurs de données d’Artsdata ;
- Mettre les données du Contributeur à disposition pour les consommateurs de données par le biais du terminal SPARQL et des APIs d’Artsdata selon la licence CC0 1.0 Universal et/ou les autres licences copyleft employées par le Contributeur ;
- Générer et publier des métadonnées administratives de traçabilité indiquant le Contributeur comme la source des données contribuées ;
- Attribuer des pointages aux données selon leur niveau d’autorité, de fiabilité et d’exhaustivité ;
- Attribuer des identifiants Artsdata aux entités principales des données du Contributeur, lorsque celles-ci ne s’en sont pas encore vu attribuer, ou lier les entités principales à leur identifiant Artsdata lorsque celui-ci existe déjà ;
- Copier les données, en totalité ou en partie, dans le graphe central d’Artsdata et les adapter, notamment en les agençant avec des données provenant d’autres graphes sources ;
- Préserver les données dans le graphe central, même lorsque l’entité auxquelles les données se réfère n’est plus disponible dans le graphe source (comme, par exemple, préserver les données d’un événement passé) ;
- Réaliser diverses activités d’enrichissement sémantique des données, dans le graphe source ou dans le graphe central, comme par exemple :
- Détecter et corriger les erreurs mineures dans la syntaxes des données ;
- Détecter le fuseau horaire d'un lieu, attribuer un identifiant de fuseau horaire au lieu ;
- Ajouter le fuseau horaire des dates/heures, lorsque celui-ci est manquant, ou le corriger, lorsque celui-ci est inexact ;
- Transformer les URL d’image en schema:ImageObject, conformément à la politique d’images d’Artsdata ;
- Lier les entités secondaires identifiables (par exemple, des personnes, des organismes ou de lieux) à des identifiants pérennes existants (identifiant Artsdata, identifiant Wikidata, ISNI) ;
- Intégrer des points de données additionnels récupérés par le biais des identifiants pérennes.
Les données chargées dans Artsdata sont mises en valeur par les consommateurs de données d’Artsdata. Elles peuvent aussi être indexées, lues, copiées et/ou entreposées par les moteurs de recherche et d’autres tiers, tel qu’autorisé par la license CC0 1.0 Universal.
Artsdata ne fournit aucune garantie et n’assume aucune responsabilité en regard de l’utilisation des données chargées dans Artsdata.
Pour toutes questions à propos de ces conditions, veuillez contacter l’équipe d’Artsdata à artsdata@capacoa.ca.
1 Par personnel d’Artsdata, on entend le personnel de CAPACOA, de La culture crée et/ou tout autre tiers autorisé à contribuer à l’intendance graphe de connaissances Artsdata.