Polona Gantar | Leksikografija v dobi umetne inteligence

Vabimo vas na predavanje predmeta Frazeologija in paremiologija, ki ga bo imela znanstvena sodelavka dr. Polona Gantar:

 

Leksikografija v dobi umetne inteligence: digitalna slovarska baza z leksikografskega in tehnološkega vidika.

 

Predavanje bo namenjeno predstavitvi organizacije slovarskih podatkov v Digitalni slovarski bazi, kot jo vidita leksikograf in jezikovni tehnolog. Leksikografi kot tudi človeški uporabniki vidimo slovarsko geslo kot hierarhično urejen odnos med podatki, kjer pod posameznimi besedami in zvezami (iztočnicami) najdemo pomene, izvemo, kako se sklanjajo oz. spregajo in naglašujejo, kako njihove pomene rabimo v določenem govornem položaju ipd. Že iz šole tudi vemo, da posamezni specializirani deli gesla, kot sta denimo frazeološko in terminološko gnezdo, prinašajo primere specifičnih rab in da je koristno, če se v slovarju lahko poučimo o posebnostih standardnih in nestandardnih oblik oz. o njihovih variantah. Jezikovne tehnologe na drugi strani zanima predvsem formalizacija jezikovnih pojavov: kako jezikovne podatke zapisati v obliki, da jih bo prepoznal računalnik. Jezikovni modeli, na katerih temeljijo digitalne slovarske baze, že nekaj časa, predvsem pa z nastopom elektronskih slovarjev, opuščajo hierarhično predstavitev podatkov, kot jo denimo določa format xml. Z nastopom t. i. relacijskih baz, v katerih je ključno ločevanje med podatkovnim in prikaznim nivojem, so vsi podatki povezani linearno, kar omogoča neomejeno število prikazov iskanj v slovarskem vmesniku z različnih zornih kotov. Kje se srečata (in ločita) leksikografski in tehnološki pogled na jezikovni opis, bomo prikazali na primeru večbesednih leksikalnih enot, ki predstavljajo trd oreh tako za leksikografski opis (klasifikacija, pomen, prenesenost) kot pri tehnološki obdelavi (večbesednost, nekontinuiranost). Ob tem se bomo dotaknili nekaterih tipičnih slovarskih dilem, kot je denimo prepoznavanje stopnje pomenske prozornosti in prenesenosti pri frazeoloških enotah ter prehajanje večbesednih enot med posameznimi tipi. Na koncu se bomo na kratko pogovorili še o umetni inteligenci in njeni vlogi in izzivih na področju leksikografije. V ta namen bomo prikazali možnost uporabe UI na primeru pridobivanja slovarskih definicij za frazeološke enote.

 

Predavanje bo v torek, 26. novembra 2024 ob 16. uri v sejni sobi ZRC SAZU, Novi trg 2, 1. nadstropje, Ljubljana.

 

Apolonija Gantar je zaposlena kot znanstvena sodelavka na Filozofski fakulteti ter Fakulteti za računalništvo in informatiko UL. Raziskovalno se ukvarja z leksikalno semantiko in skladnjo, večbesednimi enotami in pomenskim opisom leksikalnih enot za človeške in strojne uporabnike. Interdisciplinarne vidike jezikoslovja in računalniške obdelave jezika združuje pri pripravi računalniško procesljivih jezikovnih virov, zlasti z vidika vključevanja semantičnih podatkov na ravni večbesednih enot z idiomatično vrednostjo. Njeni najpomembnejši znanstveni rezultati so s področja strukturiranja jezikovnih podatkov v digitalni slovarski bazi, korpusne analize večbesednih enot, kot so kolokacije, stalne zveze in frazeološke enote, ter avtomatskega pridobivanja slovarskih podatkov na podlagi oblikoskladenjsko, skladenjsko in semantično označenih korpusov. Je avtorica dveh znanstvenih monografij s področja digitalne in korpusne leksikografije ter urednica in soavtorica Digitalne slovarske baze za slovenščino, Kolokacijskega slovarja sodobne slovenščine, Slovarja sopomenk sodobne slovenščine, Velikega slovensko-madžarskega slovarja, Leksikona večbesednih enot, Slovenskega oblikoslovnega leksikona in Vezljivostnega leksikona slovenskih glagolov.

 

Vabljeni!