Che cos’è CLARIN-CH Content Search?#
CLARIN-CH Content Search è un servizio online offerto da CLARIN-CH che permette di cercare dati linguistici archiviati in diverse istituzioni in modo standardizzato. Queste risorse linguistiche includono vari tipi di corpora (cioè grandi raccolte di testi), come testi giornalistici, trascrizioni del Parlamento europeo, sottotitoli di film e altre collezioni.
Dopo aver inserito il termine di ricerca, CLARIN-CH Content Search mostrerà un elenco di esempi rilevanti tratti dai corpora, con informazioni sul corpus e sull’istituzione che lo fornisce, oltre a link alle risorse.
Attualmente, CLARIN-CH Content Search dà accesso a corpora pubblici selezionati da:
Swiss-AL, una piattaforma di dati linguistici per le scienze applicate sviluppata dal ZHAW Digital Discourse Lab, e
la LCP Corpus Platform, sviluppata da LiRI – Linguistic Research Infrastructure.
CLARIN-CH Content Search è una realizzazione svizzera della CLARIN Federated Content Search (FCS), un sistema che permette di cercare una vasta gamma di risorse linguistiche in modo standardizzato.
Vedi anche: Come cercare in altri corpora
Come si usa CLARIN-CH Content Search?#
Per eseguire una semplice ricerca per parola, vai al campo Text Layer CQL Query nella parte superiore della pagina, inserisci la tua query (per esempio, “Hashtag”) e premi il pulsante di ricerca o il tasto Invio.
Una volta avviata la ricerca, i risultati vengono caricati man mano che arrivano le risposte dalle varie risorse. Puoi regolare il numero di risultati per risorsa (fino a 50 risultati per endpoint). Inoltre puoi:
Filtrare i risultati per lingua

Filtrare i risultati per risorsa

Quando la ricerca è completata (per esempio, “2/2 complete” per due endpoint che rispondono), vedrai un elenco di risorse con risultati.
Puoi scegliere di visualizzare i risultati nel formato KWIC (Key Word in Context), un formato comunemente utilizzato nella linguistica dei corpora per osservare rapidamente come viene usata una parola nel contesto.
Se sei particolarmente interessato a una risorsa, puoi cliccare su View per concentrarti sui suoi risultati. Lì troverai anche dettagli aggiuntivi su quel corpus e sulle lingue che contiene.
Posso cercare anche in altri corpora e lingue?#
Puoi usare l’aggregatore FCS fornito da CLARIN.eu per cercare in oltre 500 risorse linguistiche in più di 160 lingue. Quando utilizzi l’aggregatore, la tua ricerca viene inviata a diversi endpoint (non solo quelli svizzeri). Ciascun endpoint interroga i propri dati e restituisce i risultati, che vengono poi combinati in un elenco unificato.
FCS offre un’interfaccia standardizzata per interrogare e visualizzare i dati tra diverse istituzioni. Al contrario, gli endpoint nazionali come CLARIN-CH possono offrire funzionalità aggiuntive o personalizzate.
Per maggiori informazioni, consulta il CLARIN Content Search Tutorial.