Berend Gábor (SZTE TTIK Informatikai Intézet)
Automatikus kulcsszókinyerés és alkalmazási lehetőségei
A dokumentumok lényegét tömören leíró kulcsszavak hasznos segítséget nyújthatnak a digitális bölcsészet területein, melyek egyebek mellett a katalogizáló,
-és kivonatoló rendszerekben vagy információ-visszakereső alkalmazásokban is sikeresen fölhasználhatók. Mivel a kulcsszavak előállítása – a feldolgozandó
dokumentumok volumenéből adódóan – sok esetben hosszadalmas és költséges lehet, automatikus meghatározásuk kétségtelen hasznossággal bír.
Az előadásban rövid bemutatásra kerülnek a szöveges dokumentumokat kulcsszavakkal automatikusan ellátni képes eljárások fő típusai, illetve az ezek elkészítését
lehetővé tevő fontosabb angol, illetve magyar nyelvű szöveges adatbázisok. Az előadás során az SZTE nyelvtechnológiai csoportja által fejlesztett, újszerű
megoldásokat alkalmazó kulcsszókinyerő rendszer is bemutatásra kerül majd, melyet az eddigiekben változatos forrásból származó dokumentumokon (tudományos
publikációk, híranyagok, valamint termékvéleményezések) alkalmaztunk sikerrel.
A kvantitatív mutatók alkalmazása mellett a dokumentumokhoz rendelt kulcsszavak megfelelő minőségére azok végalkalmazásokban történő felhasználása útján is
következtethetünk. Az előadás során az automatikusan meghatározott kulcsszavak kvantitatív kiértékelésének egy lehetséges kiegészítéseként is tekinthető
kulcsszavakon alapuló korpuszvizualizációs eljárásról is szó fog esni. Korábbi eredményeink azt mutatták, hogy a korpuszvizualizáció mellett egy további
alkalmazási terület, a dokumentumklaszterezés is hatékonyabbá tehető kulcsszavakra támaszkodva, mellyel kapcsolatos eredményeinkről szintén szó lesz az előadáson.