Wikidata est une base de connaissances qui contient des concepts et indique leurs relations. Vous pouvez y ajouter des mots et les lier aux concepts qu'ils représentent.
Une base de connaissance permet à un ordinateur de répondre rapidement à des questions liées à des données. Par exemple « Quelles sont les villes les plus grandes dont le maire est une femme ? », « De quelles personnes célèbres est-ce l'anniversaire aujourd'hui ? », « Combien d'enfants sont nés en moyenne en Angleterre ces 10 dernières années ? », « Quels groupes de musique chantent en occitan ? »...
Wikidata est une base de connaissance que tout le monde peut interroger. Elle permet de faire des statistiques, mais elle est aussi très importante pour l'analyse de sens en traitement automatique du langage. Elle permet, par exemple, de construire des services automatiques de questions-réponses, de l'analyse d'opinion à partir des réseaux sociaux, des programmes qui résument des textes, de la classification automatique de documents...
Parmi les applications que Wikidata rend possible si elle est assez complète en occitan, nous pouvons imaginer, par exemple :
Plus Wikidata aura de lexèmes et plus ces lexèmes seront liés à des concepts, plus ce type d'outils sera efficace et facile à réaliser.
Pour ajouter des lexèmes sur Wikidata, il faut les compétences suivantes :
Ajouter un lexème et ses formes ne demande pas de grandes compétences en informatique. Mais les étapes facultatives qui suivent peuvent être un peu plus difficiles pour quelqu'un qui n'est pas à l'aise avec un ordinateur.
Avoir des connaissances en traitement automatique du langage vous aidera beaucoup à comprendre l'articulation entre tous les champs des lexèmes. Si c'est davantage le côté linguistique qui vous intéresse, peut-être que vous serez plus à l'aise si vous contribuez sur le Wikiccionari.
Il vous faut d'abord créer un compte sur Wikidata ou vous connecter si vous avez déjà un compte. Si vous avez un compte sur Wikipèdia, Wikiccionari, Wikimedia Commons ou Wikisources, vous utiliserez le même pour Wikidata.
Pour pouvoir traduire des items en occitan, il vous faut être connecté. Pour vous connecter, cliquez sur « Log in » en haut à droite du site de Wikidata.
Pour éviter de rentrer des lexèmes en double, commencez par vérifier s'il n'existe pas déja. Pour ce faire, allez sur la page d'accueil de Wikidata. Dans le formulaire de recherche en haut à droite, tapez lexeme: sans espace avant les deux point) suivi du mot que vous voulez créer.
Vous arrivez sur la page de résultats de la recherche. Si le mot existe déjà, pas besoin de le créer, vous pouvez cliquer dessus et passer directement à l'étape 5 ou aux suivantes. Si le mot n'existe pas, vous pouvez le créer comme indiqué à l'étape suivante.
Allez à l'adresse www.wikidata.org/wiki/Special:NewLexeme.
Entrez les informations de base pour votre lexème :
Quand vous avez entré toutes les informations, cliquez sur « Créer ».
Il vous faut d'abord ajouter la forme qui correspond au lemme. Cliquez sur « Ajouter une forme » dans la partie « Formes ».
Dans la boîte qui s'ouvre, indiquez l'orthographe du mot dans le champ « Représentation ». Laissez « oc » dans la variante d'orthographe. Les informations de variété et de graphie seront indiquées ailleurs.
Dans le champ « caractéristiques grammaticales », indiquez toutes les caractéristiques propres à la forme (par opposition à celles qui sont générales au lexème, comme le genre d'un nom) :
Quand vous avez entré toutes les informations de la forme, cliquez sur « publier ».
Ajouter une forme
Vous pouvez répéter cette manipulation pour ajouter toutes les formes fléchies que vous désirez (verbes conjugués, féminin, pluriel...).
Si une forme apparaît dans une aire géographique spécifique de l'occitan, vous pouvez l'indiquer. Cliquez sur « Ajouter une déclaration » en bas à droite de la forme.
Dans le champ « propriété », tapez « localisation géographique ». Un champ apparaît à droite, dans lequel vous pouvez taper la zone correspondant à la localisation (Languedoc, Béarn, Marseille...). L'outil vous propose plusieurs résultats. Cliquez sur celui qui vous convient. Quand il est sélectionné, cliquez sur « publier » à droite du bloc de propriété pour enregistrer la localisation.
Indiquer l'aire géographique d'une zone
Si la forme apparaît dans plusieurs aires géographiques, vous pouvez répéter cette manipulation en choisissant une zone différente à chaque fois.
Cliquez sur « ajouter un sens » dans la partie « Sens ». Un bloc s'ouvre, qui vous permet d'ajouter une description du sens dans la langue de votre choix. Vous pouvez par exemple décrire en français le sens d'un mot occitan, ou inversement.
Choisissez la langue dans laquelle vous ferez la description en cliquant dans le champ « Langue ». Commencez à taper la langue désirée. L'outil vous propose des langues en fonction de ce que vous tapez. Cliquez sur une langue pour la choisir.
Ajouter un sens
Dans le champ « Apparence », tapez ensuite la description du sens dans la langue que vous avez choisie. Une description est une phrase courte, pas une définition ultra complète.
Vous pouvez ajouter des traductions de la description dans d'autres langues encliquant sur « Ajouter » en-dessous de la description.
Ajouter des descriptions à un sens
Quand vous avez ajouté toutes les descriptions désirées, cliquez sur « publier » à droite de l'outil.
C'est une étape très importante. Elle permet aux ordinateurs de comprendre la signification du mot, et donc de construire des outils comme l'analyse ou le résumé de texte, la compréhension de question, la production de réponses appropriées...
Vous devez d'abord trouver l'identifiant du concept représenté par le lexème. Pour ce faire, ouvrez un nouvel onglet et allez sur la page d'accueil de Wikidata. Dans le formulaire de recherche en haut à droite, tapez le mot (ou sa traduction en français ou en anglais s'il n'y a pas de réponse en occitan). L'outil vous propose plusieurs réponses. Cliquez sur celle qui est la bonne.
Vous arrivez sur la page du concept. Après le titre, il y a entre parenthèses un identifiant qui commence par Q. Copiez cet identifiant.
Revenez sur la page d'édition du lexème. Il faut créer (voir étape précédente) ou trouver le sens qui correspond au concept. Une fois fait, cliquez sur « ajouter une déclaration » en bas à droite de ce sens.
Dans le champ « propriété », tapez P5137 ou « élément pour ce sens ». L'outil vous propose une réponse, cliquez dessus.
Choisir la propriété
Dans le champ qui est apparu à droite de la propriété, collez l'identifiant du concept. L'outil vous propose une réponse. Cliquez dessus.
Coller l'identifiant
Cliquez sur « publier » pour enregistrer le lien au concept.
Vous pouvez relier un mot à un autre mot en indiquant leur relation grâce au système des déclarations. Attention, il faut que le lien de synonymie, traduction... soit fait dans le sens du mot qui correspond à celui de son synonyme, de sa traduction...
Après avoir créé un sens (voir étapes précédentes), cliquez sur « ajouter une déclaration » en bas de ce sens.
Dans la boîte qui s'ouvre, dans le champ « propriété », recherchez la propriété qui correspond à la relation. Commencez à taper et l'outil vous fait plusieurs propositions. Cliquez sur celle qui représente le lien que vous voulez faire.
Rechercher une propriété
Parmi les propriétés les plus courantes, on trouve : dérivé de, composé de auxilliaire verbal, lexème homographe, est suivi de, traduction, synonyme, antonyme, troponyme de, faux-ami.
Une fois la propriété choisie, il vous faut trouver l'identifiant du sens du mot que vous ciblez. Pour ce faire, ouvrez un nouvel onglet et allez sur la page d'accueil de Wikidata. Dans le formulaire de recherche en haut à droite, tapez lexeme: (sans espace avant les deux points) suivi du mot que vous recherchez. Vous arrivez sur la page des résultats. Cliquez sur le mot que vous recherchez. Sur la page du mot, descendez jusqu'à la partie « Sens ». Si des sens sont créés, ils ont tous un identifiant du type L suivi de numéros, un tiret, S suivi d'un numéro. Ex. : « L41768-S1 ». Il vous faut copier cet identifiant.
Retournez sur la page du lexème que vous êtes en train d'éditer. Dans le champ de texte en face de la propriété, collez l'identifiant. L'outil vous propose une réponse. Cliquez dessus.
Collez l'identifiant du mot
Cliquez sur « publier » pour enregistrer la relation.
Vous pouvez ajouter d'autres propriétés au lexème, à ses formes, à ses sens...en ajoutant des déclarations de la manière expliquée ci-dessus. Vous pouvez consulter la liste des propriétés des lexèmes pour connaître toutes les informations que vous pouvez ajouter.
Si vous recherchez l'identifiant d'un concept, tapez-le tel quel dans la barre de recherche. Si vous recherchez l'identifiant d'un autre lexème, il faut taper lexeme: (sans espace avant les deux points) suivi du mot.