Haku

TRIX-tiedonhakujärjestelmän evaluointi

QR-koodi

TRIX-tiedonhakujärjestelmän evaluointi

Hakutermit:

XML, tiedonhakujärjestelmät, arviointi

Tutkimus esittelee Tampereen yliopistossa vuonna 2004 kehitetyn TRIX-tiedonhakujärjestelmän. TRIX on erityisesti XML-dokumenteista tehtävään tiedonhakuun kehitetty osittaistäsmäyttävä, hierarkkiseen tietorakenteeseen perustuvaa indeksointiratkaisua käyttävä tiedonhakujärjestelmän prototyyppi. Tutkimuksen tutkimuskysymyksinä oli selvittää onko järjestelmän kahden eri hakuavainten painojen yhdistämismenetelmän välillä eroa sekä tutkia miten painotuskaavan vakion säätäminen vaikuttaa järjestelmän toimintaan.

Järjestelmää testattiin kansainvälisen INEX-evaluointihankkeen testikokoelmassa, joka koostuu noin 12000:ta XML-merkatusta tieteellisestä artikkelista. Aineistoon tehtiin kyselyjä yhteensä 76 hakuaiheesta ja tuloksia arvioitiin kahdella XML-tiedonhaun evaluointiin kehitetyllä mittarilla. Lisäksi tutkimusta varten kehitettiin oma ohjelma tuloslistojen analysointiin.

Tutkimuksen tuloksina havaittiin, että painojen yhdistämismenetelmien välillä ei ollut merkitsevää eroa sekä että painotuskaavan vakion säätämisellä on voimakas vaikutus järjestelmän palauttamien elementtien kokoon ja vaihteleva vaikutus evaluointimittareiden antamiin tuloksiin.

Tallennettuna: