Haku

tiedonharavointi
en   data scraping; data harvesting
määritelmä   
tietojen automaattinen kokoaminen ihmisen luettavassa muodossa olevasta aineistosta
huomautus   
Tiedonharavointia käytetään silloin, kun tiedot ovat saatavilla vain tekstimuodossa esimerkiksi siksi, että ne ovat ihmisten kirjoittamaa vapaata tekstiä tai sellaisen järjestelmän tulostamia, josta tietoa ei saa muussa muodossa.
Tiedonharavoinnissa tekstimassasta kerätyt tiedot voidaan tallentaa esimerkiksi taulukkomuotoon, jolloin on mahdollista vaikkapa aakkostaa tekstissä esiintyneet nimet tai esittää numerot nousevassa tai laskevassa suuruusjärjestyksessä tai vertailla eri lähteistä kerättyä tietoa. Tekstin haravoinnissa saatuja tietoja voi käyttää myös koostesovellusten tekemiseen, jolloin esimerkiksi tekstissä esiintyneet paikannimet pystyy sijoittamaan kartalle.
Verkkosivujen haravointi (engl. web scraping, web harvesting, screen scraping) on tiedonharavointia, jossa tietoja kerätään verkkosivuilta.

Käsitejärjestelmäkaavio: Tiedonhaku
Lähde: Tietotekniikan termitalkoot, 2013-10-22

Kommentit eivät tule näkyville julkisesti!
Nimi:
Sähköposti:
Palaute: