Támop logó

Berend Gábor (SZTE TTIK Informatikai Intézet)

Automatikus kulcsszókinyerés és alkalmazási lehetőségei


A dokumentumok lényegét tömören leíró kulcsszavak hasznos segítséget nyújthatnak a digitális bölcsészet területein, melyek egyebek mellett a katalogizáló, -és kivonatoló rendszerekben vagy információ-visszakereső alkalmazásokban is sikeresen fölhasználhatók. Mivel a kulcsszavak előállítása – a feldolgozandó dokumentumok volumenéből adódóan – sok esetben hosszadalmas és költséges lehet, automatikus meghatározásuk kétségtelen hasznossággal bír.
Az előadásban rövid bemutatásra kerülnek a szöveges dokumentumokat kulcsszavakkal automatikusan ellátni képes eljárások fő típusai, illetve az ezek elkészítését lehetővé tevő fontosabb angol, illetve magyar nyelvű szöveges adatbázisok. Az előadás során az SZTE nyelvtechnológiai csoportja által fejlesztett, újszerű megoldásokat alkalmazó kulcsszókinyerő rendszer is bemutatásra kerül majd, melyet az eddigiekben változatos forrásból származó dokumentumokon (tudományos publikációk, híranyagok, valamint termékvéleményezések) alkalmaztunk sikerrel.
A kvantitatív mutatók alkalmazása mellett a dokumentumokhoz rendelt kulcsszavak megfelelő minőségére azok végalkalmazásokban történő felhasználása útján is következtethetünk. Az előadás során az automatikusan meghatározott kulcsszavak kvantitatív kiértékelésének egy lehetséges kiegészítéseként is tekinthető kulcsszavakon alapuló korpuszvizualizációs eljárásról is szó fog esni. Korábbi eredményeink azt mutatták, hogy a korpuszvizualizáció mellett egy további alkalmazási terület, a dokumentumklaszterezés is hatékonyabbá tehető kulcsszavakra támaszkodva, mellyel kapcsolatos eredményeinkről szintén szó lesz az előadáson.