Was ist die CLARIN-CH Content Search?#
CLARIN-CH Content Search ist ein Online-Dienst von CLARIN-CH, der dir erlaubt, Sprachdaten, die über mehrere Institutionen verteilt sind, auf standardisierte Weise zu durchsuchen. Diese Sprachressourcen umfassen verschiedene Arten von Korpora (also grosse Textsammlungen), wie journalistische Texte, Transkripte des Europäischen Parlaments, Film-Untertitel und andere Sammlungen.
Nachdem du deinen Suchbegriff eingegeben hast, zeigt dir CLARIN-CH Content Search eine Liste relevanter Korpusbeispiele an – zusammen mit Infos über das Korpus, die Institution, die es bereitstellt, sowie Links zu den Ressourcen.
Aktuell bietet die CLARIN-CH Content Search Zugang zu ausgewählten öffentlichen Korpora von:
Swiss-AL, einer Sprachdatenplattform für die Angewandten Wissenschaften, entwickelt vom ZHAW Digital Discourse Lab, und
der LCP Corpus Platform, entwickelt von LiRI – Linguistic Research Infrastructure.
CLARIN-CH Content Search ist eine Schweizer Umsetzung der CLARIN Federated Content Search (FCS), einem System, das die standardisierte Suche über eine Vielzahl von Sprachressourcen ermöglicht.
Siehe auch: Wie kann ich in anderen Korpora suchen
Wie benutzt man die CLARIN-CH Content Search?#
Für eine einfache Wortsuche gehst du zum Feld Text Layer CQL Query oben auf der Seite, gibst deinen Suchbegriff ein (zum Beispiel “Hashtag“) und drückst die Suchschaltfläche oder die Enter-Taste.
Sobald die Suche startet, laden die Ergebnisse nach und nach, sobald Antworten von den jeweiligen Ressourcen eintreffen. Du kannst die Anzahl der Treffer pro Ressource anpassen (bis zu 50 Treffer pro Endpunkt). Ausserdem kannst du:
Ergebnisse nach Sprache filtern

Ergebnisse nach Ressource filtern

Wenn die Suche abgeschlossen ist (zum Beispiel “2/2 complete” bei zwei antwortenden Endpunkten), siehst du eine Liste der Ressourcen mit Treffern.
Du kannst die Ergebnisse im KWIC-Format (Key Word in Context) anzeigen lassen – ein Format, das in der Korpuslinguistik oft genutzt wird, um schnell zu sehen, wie ein Wort im Kontext verwendet wird.
Wenn dich eine bestimmte Ressource besonders interessiert, kannst du auf View klicken, um dich auf deren Ergebnisse zu konzentrieren. Dort findest du auch weitere Details über das Korpus und die enthaltenen Sprachen.
Kann ich auch in anderen Korpora und Sprachen suchen?#
Du kannst den von CLARIN.eu bereitgestellten FCS Aggregator nutzen, um über 500 Sprachressourcen in mehr als 160 Sprachen zu durchsuchen. Wenn du den Aggregator verwendest, wird deine Anfrage an mehrere Endpunkte gesendet (nicht nur an die Schweizer). Jeder durchsucht seine eigenen Daten und gibt Ergebnisse zurück, die dann zu einer einheitlichen Ergebnisliste zusammengeführt werden.
FCS bietet eine standardisierte Schnittstelle zum Abfragen und Anzeigen von Daten über Institutionsgrenzen hinweg. Nationale Endpunkte wie CLARIN-CH können zusätzlich erweiterte oder angepasste Funktionen bieten.
Weitere Infos findest du im CLARIN Content Search Tutorial.