Tomaž Erjavec | Korpusi parlamentarnih razprav

Vabimo vas na javno predavanje, ki ga bo na modulu leksikologija, leksikografija, slovničarstvo imel izr. prof. dr. Tomaž Erjavec:

 

Korpusi parlamentarnih razprav.

 

Korpusi parlamentarnih razprav niso zanimivi samo za jezikoslovce, temveč tudi za družboslovce, zgodovinarje in vse ostale, ki bi hoteli analizirati politično dogajanje v svoji državi. Za razliko od ostalih virov je take korpuse mogoče tudi opremiti s podrobnimi osebnimi podatki govorcev, s čimer postanejo ti korpusi toliko bolj uporabni. Predavanje bo predstavilo zgodovino izdelave parlamentarnih korpusov v Sloveniji in delo na takih korpusih v okviru infrastrukture CLARIN, nato pa se osredotočilo na projekt ParlaMint, ki ga sofinancira CLARIN ERIC in v katerem imamo slovenski raziskovalci ključno vlogo. V prvi, že zaključeni fazi projekta, smo izdelali 17 korpusov razprav v parlamentih evropskih držav v obdobju 2015-2021. Korpusi so odprto dostopni, opremljeni z bogatimi meta-podatki in jezikoslovno označeni, dostopni pa so tudi na konkordančnikih CLARIN.SI. V drugi fazi, ki še poteka, bomo obstoječe korpuse osvežili z razpravami do sredine 2022, izdelali 13 novih (tudi regionalnih) korpusov, dodali nove metapodatke in korpuse avtomatsko prevedli v angleščino.

 

Predavanje bo v ponedeljek, 24. aprila 2023, ob 16. uri, v sejni sobi ZRC SAZU, Novi trg 2, 1. nadstropje, Ljubljana.

 

Tomaž Erjavec je zaposlen na Odseku za tehnologije znanja na Institutu »Jožef Stefan« in na Inštitutu za slovenski jezik Frana Ramovša na ZRC SAZU ter je nacionalni koordinator slovenske raziskovalne infrastrukture za jezikovne vire in tehnologije CLARIN.SI. Glavna področja njegovega dela so razvoj jezikovnih virov ter standardov in metod za njihovo kodiranje in označevanje. Sodeloval je v številnih slovenskih in mednarodnih projektih in je najbolj citiran raziskovalec s področja jezikoslovja v Sloveniji.

 

Vabljeni!