Haku

Information Retrieval in the World Wide Web

QR-koodi

Information Retrieval in the World Wide Web

Tiedonhaku World Wide Web -ympäristössä

Tämä työ keskittyy World Wide Web (WWW) -ympäristössä tapahtuvan tiedonhaun kehittämiseen. Tiedonhakuprosessi jaetaan indeksointi- ja etsimisvaiheeseen. Nämä vaiheet analysoidaan huomioiden WWW:n erityispiirteet verrattuna perinteisiin informaatiojärjestelmiin.

Indeksointivaiheessa WWW:n tietoavaruus muutetaan hakukelpoiseksi tietorakenteeksi. WWW:n suuri koko ja erittäin heterogeeninen sisältö vaativat monipuolisen ja tarkan indeksoinnin laadukkaiden hakutulosten saavuttamiseksi. Pelkkä dokumenttien sisällön analysoiminen ei tarjoa riittävästi informaatiota, vaan myös muita lähteitä, kuten linkkirakennetta, tulee käyttää indeksin rakentamiseen. Indeksin laatua voidaan edelleen parantaa lisäämällä dokumentteihin metatietoa, sillä automaattiset analysointimenetelmät eivät pysty purkamaan kaikkea informaatiota ihmisille tarkoitetuista dokumenteista, eikä kaikki tarvittava tieto edes ole löydettävissä dokumenttien sisällöstä. WWW:ssä käytettäväksi soveltuvat metatietojärjestelmät esitellään.

Etsintävaiheessa käyttäjän tulisi kyetä ilmaisemaan tiedontarpeensa tiedonhakujärjestelmän kielellä. Käyttäjän tiedontarpeet jaetaan lyhytkestoisiin ja pitkäkestoisiin tarpeisiin. Tätä jakoa vastaavasti tiedonhaun kysely- ja suodatusmallit esitellään. Hakulausekkeen muodostamisen lisäksi informaation esitystekniikat ovat tärkeitä, koska vastausjoukot tulee järjestää käyttäjälle esittämistä varten. Klusterointitekniikat, joilla informaatiota voidaan esittää eri tasoilla, käydään läpi.

Työn viimeinen osa käsittelee COBRA-projektia, jonka päämääränä oli kehittää sähköisen välitystoiminnan arkkitehtuurimalli. Käsite tiedonvälitys määritellään, ja sitä verrataan tiedonhakuun. Projektin puitteissa toteutettu tiedonvälitysjärjestelmä esitellään.

Tallennettuna: