Hakemistot
tiedonharavointi
en data scraping; data harvesting
määritelmä
tietojen automaattinen kokoaminen ihmisen luettavassa muodossa olevasta aineistosta
tietojen automaattinen kokoaminen ihmisen luettavassa muodossa olevasta aineistosta
huomautus
Tiedonharavointia käytetään silloin, kun tiedot ovat saatavilla vain tekstimuodossa esimerkiksi siksi, että ne ovat ihmisten kirjoittamaa vapaata tekstiä tai sellaisen järjestelmän tulostamia, josta tietoa ei saa muussa muodossa.
Tiedonharavointia käytetään silloin, kun tiedot ovat saatavilla vain tekstimuodossa esimerkiksi siksi, että ne ovat ihmisten kirjoittamaa vapaata tekstiä tai sellaisen järjestelmän tulostamia, josta tietoa ei saa muussa muodossa.
Tiedonharavoinnissa tekstimassasta kerätyt tiedot voidaan tallentaa esimerkiksi taulukkomuotoon, jolloin on mahdollista vaikkapa aakkostaa tekstissä esiintyneet nimet tai esittää numerot nousevassa tai laskevassa suuruusjärjestyksessä tai vertailla eri lähteistä kerättyä tietoa. Tekstin haravoinnissa saatuja tietoja voi käyttää myös koostesovellusten tekemiseen, jolloin esimerkiksi tekstissä esiintyneet paikannimet pystyy sijoittamaan kartalle.
Verkkosivujen haravointi (engl. web scraping, web harvesting, screen scraping) on tiedonharavointia, jossa tietoja kerätään verkkosivuilta.
Käsitejärjestelmäkaavio: Tiedonhaku
Lähde: Tietotekniikan termitalkoot, 2013-10-22