Wikibase/DataModel/Introduction
Ceci est une entrée en matière du modèle de données Wikibase. Pour une spécification plus technique, voir la spécification du modèle de données.
Résumé du modèle de données
Le contenu de la base de connaissance Wikibase peut se résumer aux éléments suivants.
Une base de connaissances Wikibase est une collection d'entités. Les entités (entities) sont les composants élémentaires de la base de connaissances décrivables et référençables en utilisant le modèle de données. Deux types d'entités sont prédéfinis : les éléments (items) et les propriétés (properties). Vous pouvez étendre Wikibase pour qu'il prenne en charge des types d'entités supplémentaires .
La description des éléments et des propriétés est structurée de la manière suivante.
- Elément
- identifiant de l'élément (nombre préfixé par Q)
- empreinte, constituée de :
- une étiquette multilingue*
- une description multilingue*
- des alias multilingues
- des déclarations, chacune étant constituée de :
- Définition, constituée de :
- Propriété
- Valeur
- Qualifieurs (paires propriété-valeur supplémentaires)
- Références (chacune étant constituée d'une ou plusieurs paires de propriété-valeur)
- Rang
- Définition, constituée de :
- liens de sites
- Propriété
- identifiant de la propriété (nombre préfixé par P)
- empreinte, constituée de :
- une étiquette multilingue*
- une description multilingue*
- des alias multilingues
- des déclarations, chacune étant constituée de :
- Définition, constituée de :
- Propriété
- Valeur
- Qualifieurs (paires propriété-valeur supplémentaires)
- Références (chacune étant constituée d'une ou plusieurs paires de propriété-valeur)
- Rang
- Définition, constituée de :
- type de donnée
(*) Sauf quand le libellé et (ou) la description d'une entité ne sont pas vides, dans le cadre d'un type d'entité la combinaison pour une entité d'un libellé et de la description dans une langue donnée doivent être uniques.
Eléments
Chaque page de Wikibase décrit un seul élément. Les éléments servent à Wikibase pour référencer tout ce qui a un intérêt, et habituellement ils sont le sujet des articles de Wikipedia. Donc dans Wikibase nous aurons un élément pour Berlin, et ce qu'il représente c'est le sujet des articles Wikipedia liés à cet élément dans les différentes langues. Les articles Wikipedia identifient la signification d'un élément.
Chaque élément a un libellé (son nom) et une description pour chaque langue de Wikibase. Le libellé seul n'est pas suffisant car il pourrait être ambigu : Berlin peut représenter la capitale de l'Allemagne, une ou plus d'une douzaine de villes des USA, un album de Lou Reed, un orchestre américain new wave, ou beaucoup d'autres choses. Le libellé et la description ensemble doivent identifier la signification de l'élément, par exemple le libellé « Berlin » et la description « Une ville d'Allemagne » permettent l'identification de manière unique dans chaque langue.
En plus des libellés les éléments peuvent avoir des alias qui sont des noms alternatifs permettant de trouver un élément. « George H. W. Bush » peut aussi être trouvé sous « George Bush » qui peut être son fils. Les alias sont faits pour offrir à l'utilisateur des facilités pour la recherche, plutôt comme les redirections Wikipedia, et ainsi même les fautes les plus courantes peuvent être utilisées comme alias.
Problème de fondement des symboles
Si vous suivez ce qui a été dit, vous aurez remarqué qu'à la fois les liens Wikipedia et le libellé avec la description identifient la signification d'un élément. Et pas seulement cela : ils font cela dans toutes les langues ! Mais il est possible que ces identifiants se désynchronisent : le lien de la Wikipedia Allemande pourrait pointer vers Berlin, Kentucky et la description anglaise pourrait dire « Capital of Germany ». C'est vrai, et il n'y a rien dans le système pour empêcher cela : il n'existe pas de mécanisme au niveau de la langue ou de l'identification qui ait la priorité sur un autre. Ici nous abordons le problème du fondement des symboles. Le chemin que nous prenons dans Wikibase pour résoudre ce problème est de fournir délibérément plusieurs manières d'identifier la signification d'un élément et de croire que des éditeurs de Wikibase viendront avec des mécanismes socio-techniques pour le résoudre suffisamment pour les cas d'utilisation de Wikibase.
Déclarations
Une des contraintes est que « Wikibase ne traite pas de la vérité, mais gère des déclarations et leurs références ». Cela signifie que dans Wikibase nous ne modélisons pas les éléments eux-mêmes, mais leur déclaration. Nous ne disons pas que Berlin a une population de 3,5 M, nous disons qu'il existe une déclaration à propos de la population de Berlin qui vaut 3,5 M en 2011, d'après le Bureau des statistiques allemandes.
Une déclaration peut être faite de
- une propriété (dans l'exemple, « population »)
- une valeur (3,5 M)
- un ou plusieurs qualifieurs optionnels (dans cet exemple, « as of 2011 » est l'un des qualifieurs)
- une ou plusieurs références optionnelles (le Bureau des statistiques allemandes)
Ensemble, la propriété, la valeur et les qualifieurs sont également appelés des claim (définitions), qui en leur ajoutant les références des sources forment une déclaration.
Il peut exister plusieurs déclarations pour la même propriété : les personnes peuvent avoir plusieurs enfants, les livres peuvent avoir plusieurs auteurs. Egalement il peut y avoir des divergences de point de vue sur la population d'une ville -- le nombre officiel et l'estimation des Nations Unies par exemple. Ou il peut y avoir des valeurs différentes selon les qualifieurs, comme les points dans le temps, ou les méthodes de mesure. Voir quelques exemples ci-dessous.
Les propriétés sont décrites sur leur propre page wiki dans Wikibase. Les propriétés ont aussi des libellés et des descriptions et en plus de cela, elles ont un type de données qui leur est associé et peut-être des propriétés supplémentaires. Le type de donnée définit le type de la valeur utilisée avec cette propriété. L'ensemble des propriétés est créé et maintenu par les éditeurs de Wikibase.
les valeurs elles-mêmes peuvent être soit très simples -- un autre élément, ou simplement une chaîne -- ou des structures beaucoup plus complexes, telles que des formes géographiques, une mesure avec son unité et sa précision, ou une valeur de temps. Nous décrirons à l'avenir les valeurs plus en détails sur leur propre page. L'ensemble des types de données est (pratiquement) prédéfini.
Il y a deux valeurs spéciales, la plupart du temps indépendantes de leur type de données : none et unknown. None signifie que nous savons que la propriété donnée n'a pas de valeur, par exemple Elizabeth Iere d'Angleterre n'a pas de conjoint. Unknown signifie que la propriété a une valeur, mais que cette dernière n'est pas connue -- par exemple le Pape Linus a certainement une année de naissance, mais on ne la connait pas. Il ne faut pas confondre cela avec le fait que l'on ne sait pas si un élément a une valeur pour une propriété spécifique, par exemple si une personne a des enfants. none et unknown ne doivent pas être confondus avec la chaîne de caractères respective : avoir pour nom « unknown » n'est pas la même chose que d'avoir un nom inconnu (qui encore n'est pas la même chose que d'être inconnu bien qu'ayant un nom).
Les références offrent une source qui prend en charge une définition donnée. Il peut y avoir plusieurs références pour une même déclaration. Nous travaillons encore sur la manière de structurer davantage une référence mais en général elles pointeront sur une source (qui sera un élément Wikibase avec ses droits : un livre, un site web, etc.) et auront d'autres informations comme la page où la déclaration est prise en charge. Une définition sans référence n'est pas forcément fausse, pas plus qu'elle n'est vraie quand elle comporte une référence. Il appartient toujours au lecteur de la déclaration de décider de croire à la définition. Nous décrirons à l'avenir les références plus en détails dans une page dédiée.
Exemples de déclarations
Deux déclarations sans qualifieurs
Une déclaration avec deux qualifieurs
Deux déclarations de la même propriété, avec chacune son qualifieur
Berlin
Population | 3,500,000 | [no sources] |
as of 2012 |
8,000 | [1 source] | |
as of 15th century |
Qualifieurs
Les qualifieurs sont utilisés pour décrire plus précisément, ou pour affiner la valeur d'une propriété donnée dans une déclaration. Ils consistent en une propriété et une valeur, qui sont les mêmes que pour les déclarations.
Alors qu'il serait pratique de pouvoir exprimer toutes les données nécessaires aux cas d'utilisation de Wikibase avec des paires propriété-valeur, ce n'est malheureusement pas le cas. Beaucoup de déclarations ont besoin de qualifieurs supplémentaires pour être formulées. Pour réduire le nombre de propriétés à une taille qui soit gérable, les qualifieurs sont utilisés pour arriver à spécifier la déclaration. Les qualifieurs peuvent être utilisés de différentes façons, comme indiqué dans les exemples suivants.
Un qualifieur peut modifier la signification de l'élément (« France: Superficie 213,010 sq mi - sans la Terre Adélie »), modifier la propriété (« Berlin: Population 3,500,000 - méthode Estimation »), contraindre la validité de la valeur (« Germany: Population 80,000,000 - en 2011 »), ou offrir des détails complémentaires (« Autriche: Religion Catholique - Pourcentage 64,8% » ou « Goldfinger: Acteur Sean Connery - Role James Bond »), etc. Un qualifieur attrappe-tout est supposé être une « annotation » ou quelque chose de similaire.
La communauté Wikibase est libre de maintenir et d'utiliser les qualifieurs pourvu que cela ait un sens et que cela réponde à ses cas d'utilisation. Le qualifieur fait partie intégrante de la déclaration : si vous le supprimez, la déclaration n'a plus la même signification. C'est beaucoup moins vrai pour les références.
Rangs
Comme il existe potentiellement plusieurs déclarations différentes pour un élément ou une propriété donnée, il faut choisir ceux que les requêtes Wikibase devront renvoyer. Afin de faciliter cela, trois rangs de déclarations ont été introduits. Chaque rang comporte un nombre quelconque de déclarations mais pour un rang donné, l'ordre des déclarations à l'intérieur n'a pas d'importance.
- déclarations préférées : s'il existe des déclarations préférées, ces déclarations sont renvoyées en réponse à une requête. Elles contiendront par exemple pour une population, la valeur la plus récente tant qu'elle est considérée comme suffisamment fiable. Les éditeurs Wikibase peuvent décider de marquer plusieurs déclarations comme étant des déclarations préférées : ceci peut être utilisé en cas de désaccord, pour montrer la diversité de la connaissance concernant le problème, ou cela peut être utilisé pour exprimer le fait d'avoir plusieurs valeurs (comme dans le cas des propriétés telles que « enfants »).
- déclarations normales : s'il n'existe pas de déclarations préférées (ou si la requête demande explicitement d'inclure aussi les déclarations normales), ces déclarations sont renvoyées. Les valeurs historiques telles que la population passée d'un pays peut figurer ici, tout comme les sources moins représentatives mais qui sont encore considérées comme importantes.
- déclarations obsolètes : pour les déclarations en cours de discussion, ou connues pour comporter des erreurs, mais qui sont encore listées à cause de la complétion, ou pour empêcher qu'elles soient constamment ajoutées et retirées. Les déclarations obsolètes apparaissent uniquement dans les résultats de recherche s'ils sont ajoutés explicitement ou s'ils sont sélectionnés en fonction de leur source. Un qualifieur de pied de page doit habituellement accompagner les autres déclarations par rang.
Dans Wikibase, les rangs sont aussi utilisés pour rendre l'affichage plus lisible. Seuls les déclarations favorites sont affichées par défaut, et le lecteur doit cliquer sur un lien du type Autres valeurs pour voir l'ordre normal des déclarations.