Posted in E-resursi

Tīmekļa vietņu rasmošana

© Margarita Dankova, 2011

Jau kopš pirmo civilizāciju laikiem pasaulei ir pazīstama tāda parādība kā arhīvi – “dokumentu kopums, ko neatkarīgi no dokumentu rašanās datuma, formas, vides un informācijas nesēja uzkrāj, glabā un izmanto to arhīviskās vērtības dēļ” (1). Parasti ar vārdu “arhīvs” saprot apjomīgu dokumentu kolekciju, kas bieži vien nav visiem pieejama. Taču gadsimtu gaitā arhīvu darbības mērķi, funkcijas un atklātības līmenis vairākkārt mainījās. Mūsdienās arhīvi un bibliotēkas sastapās ar agrāk nebijušu precedentu – arvien lielāka daļa jaunu dokumentu tiek veidoti elektroniskā formātā. Lai tos saglabātu un/vai publiskotu, izmanto dažādas metodes, piemēram, izveido digitālās bibliotēkas vai datu bāzes. Taču kā rīkoties ar tādu neparastu “dokumentu” kā tīmekļa vietne?

Tīmekļa vietņu rasmošana, attēls no 3idatascraping.com

Bibliotēkzinātnē un informācijas zinātnē salīdzinoši jauns termins ir tīmekļa vietņu rasmošana (angļu val. – Web harvesting) – “automatizēta internetā pieejamo tiešsaistes publikāciju vākšana un arhivēšana” (4). Iemesls, kādēļ ir jāsaglabā tīmekļa vietnes, kas jebkuram lietotājam ir pieejamas tiešsaistē, ir ļoti vienkāršs – tīmekļa vietņu saturs un noformējums mainās gandrīz katru dienu. Pie tam, var mainīties arī tīmekļa vietnes nosaukums, tātad arī tās adrese, vai arī tīmekļa vietne var vispār pārstāt pastāvēt.

Protams, šāds process pieprasa noteiktus tehniskos resursus. Viena no programmām, kas tiek izmantota rasmošanai ir Heritrix – “programma, kas “izstaigā” visas dotā URL hipersaites, savāc un noteiktā struktūrā saglabā tur atrasto informāciju, izveidojot arhīvu” (4). Taču, pārvaldot rasmošanas darba plūsmu, ir jāpadomā arī par tādām vienkāršām lietām kā tīmekļa vietņu atlases kritēriju noteikšanu un atlases uzdevumu izpildi un kontroli (2). Turklāt, pastāv arī dažādi administratīvi un autortiesību aizliegumi.

1996. gadā tika izveidots lielākais tīmekļa vietņu arhīvs pasaulē The Internet Archive (Sanfrancisko). Taču pastāv arī daudzas citas ievērības cienīgas rasmošanas tīmekļa vietnes, piemēram:

  • Pandora (Preserving and Access Networked Documentary Resources of Australia, 1996);
  • Minerva (Mapping the Internet Electronic Resources Virtual Archive, 2000);
  • UK Web Archiving Consortium (British Library, 2003).

Arī Latvijas Nacionālā bibliotēka nodarbojas ar tīmekļa vietņu rasmošanu. Tā sākta 2005. gadā un divu gadu laikā informācija tika savākta par aptuveni 1000 valdības, kultūras, zinātnisko, izglītības, sporta un medicīnas iestāžu tīmekļa vietnēm. Līdz 2007. gadam rasmošanai bibliotēka izmantoja Heritrix (Web crawler), NutchWAX (search engine) un WERA (access tool) programmatūru (4), bet sākot ar 2008. gadu bibliotēka izmanto Web Curator Tool un Wayback Machine.

Bibliotēkas darbību aizsargā likumdošana – obligātā eksemplāra likums nosaka, ka “Latvijas Nacionālajai bibliotēkai ir tiesības un pienākums saglabāt Latvijā radītas tiešsaistes publikācijas vienu kopiju” (3), kā arī to, ka “internetā brīvi pieejamas tiešsaistes publikācijas automatizēti vāc un arhivē (rasmo) Latvijas Nacionālā bibliotēka” (3).

Izmantotie informācijas avoti

  1. Arhīvu likums [tiešsaiste] [skatīts 2011-09-12]. Pieejams: šeit.
  2. Krūmiņa, Līga. Ievads tīmekļa vietņu izstrādē [tiešsaiste] : “WWW lapu veidošanas pamati” kursa prezentācija [skatīts 2011-09-12]. Pieejams: šeit.
  3. Obligātā eksemplāra likums [tiešsaiste] [skatīts 2011-09-12]. Pieejams: šeit.
  4. Rašmane, A. Latvijas interneta vietņu rasmošana LNB. [tiešsaiste] : semināra “Aktualitātes izdevēju un bibliotēku sadarbībā” prezentācija 2008. gada 20. maijā. [skatīts 2011-09-12]. Pieejams: šeit.

2 thoughts on “Tīmekļa vietņu rasmošana

  1. Starp citu, Firefox’am ir paplašinājums “Zotero”, ar kura palīdzību arī var saglabāt tīmekļa lappušu kopijas.

  2. Lasot šo rakstu iedomājos, ka arī mēs paši patiesībā varam arhivēt atsevišķu tīmekļa vietņu lapas, izmantojot Evernote sniegtās iespējas vai arī saglabājot konkrēto lapu, izmantojot “save as” funkciju. Ilgākā laika posmā saglabātās lapas var izmantot par pamatu tīmekļa vietņu struktūras, satura un dizaina analīzei.

Izsaki viedokli!

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Mainīt )

Twitter picture

You are commenting using your Twitter account. Log Out / Mainīt )

Facebook photo

You are commenting using your Facebook account. Log Out / Mainīt )

Google+ photo

You are commenting using your Google+ account. Log Out / Mainīt )

Connecting to %s