Qu’est-ce que la CLARIN-CH Content Search ?#
CLARIN-CH Content Search est un service en ligne proposé par CLARIN-CH qui permet de rechercher des données linguistiques stockées dans plusieurs institutions, de manière standardisée. Ces ressources linguistiques incluent différents types de corpus (c’est-à-dire de grandes collections de textes), tels que des textes journalistiques, des transcriptions du Parlement européen, des sous-titres de films, et d’autres collections.
Après avoir soumis ton terme de recherche, CLARIN-CH Content Search affiche une liste d’exemples pertinents issus de corpus, accompagnée d’informations sur le corpus et l’institution qui le fournit, ainsi que de liens vers les ressources.
Actuellement, CLARIN-CH Content Search donne accès à des corpus publics sélectionnés provenant de:
Swiss-AL, une plateforme de données linguistiques pour les sciences appliquées développée par le ZHAW Digital Discourse Lab, et
la LCP Corpus Platform, développée par LiRI – Linguistic Research Infrastructure.
CLARIN-CH Content Search est une implémentation suisse de la CLARIN Federated Content Search (FCS), un système qui permet de rechercher un large éventail de ressources linguistiques de manière standardisée.
Voir aussi: Comment chercher dans d’autres corpus
Puis-je également rechercher dans d’autres corpus et langues ?#
Tu peux utiliser l’agrégateur FCS proposé par CLARIN.eu pour rechercher dans plus de 500 ressources linguistiques couvrant plus de 160 langues. Quand tu utilises l’agrégateur, ta requête est envoyée à plusieurs points d’accès (pas uniquement en Suisse). Chacun effectue sa propre recherche et retourne les résultats, qui sont ensuite combinés dans une liste de résultats unifiée.
FCS propose une interface standardisée pour interroger et afficher les données à travers différentes institutions. En revanche, les points d’accès nationaux comme CLARIN-CH peuvent offrir des fonctionnalités supplémentaires ou personnalisées.
Pour en savoir plus, consulte le CLARIN Content Search Tutorial.
Comment utiliser la CLARIN-CH Content Search ?#
Pour effectuer une recherche simple, va dans le champ Text Layer CQL Query en haut de la page, entre ta requête (par exemple, “Hashtag”) et appuie sur le bouton de recherche ou sur la touche Entrée.
Une fois la recherche lancée, les résultats apparaissent au fur et à mesure que chaque ressource répond. Tu peux ajuster le nombre de résultats par ressource (jusqu’à 50 résultats par point d’accès). Tu peux également:
Filtrer les résultats par langue
Filtrer les résultats par ressource
Lorsque la recherche est terminée (par exemple, “2/2 complete” pour deux points d’accès répondants), tu verras une liste de ressources avec des résultats.
Tu peux choisir d’afficher les résultats au format KWIC (Key Word in Context), un format couramment utilisé en linguistique de corpus, qui permet de visualiser rapidement l’utilisation d’un mot dans son contexte.
Si un corpus t’intéresse particulièrement, tu peux cliquer sur View pour te concentrer sur ses résultats. Tu y trouveras aussi des informations supplémentaires sur ce corpus et les langues qu’il contient.