Mul on siin ühed ägedad andmed, kas ma tohin neid avaldada?

Lisanud Maarja Toots 2019/04/30

Te olete veebist kokku kraapinud huvitavad andmed, laadinud need alla, võib-olla neid natuke mudinud või ehk isegi kombineerinud teiste andmetega ja saanud ühe laheda andmestiku, mida tahaksite jagada ka teistega. Tekib küsimus, kas organisatsioon või eraisik võib jagada opendata.riik.ee portaalis andmehulka, mis on saadud kellegi teise andmeid töödeldes või kombineerides?

Probleem on aktuaalne – kõik huvitavad andmed ei ole (veel) portaalis kättesaadavad ja mõned andmed ei ole allalaaditava failina kättesaadavad ka andmevaldaja kodulehel. Kas ehk agar kasutaja tohib originaalandmete valdajale siin appi tulla? Mis tingimustel? Terav vajadus selguse järele ilmnes hiljuti seoses valimistulemuste andmetega, mida andmevaldaja ei ole ise kättesaadavaks teinud, kuid mille vastu ilmutati märgatavat avalikku huvi (vt Githubi arutelulõime).

Kuna nõudeid ja reegleid, mis reguleeriksid teiseste ja töödeldud andmete avaldamist, veel ei ole, tehti nende sõnastamisega algust 18. aprilli avaandmete foorumi juriidika-teemalises töötoas. Tulise arutelu tulemusel sündisid järgmised seisukohad:

Küsimus: kas teiseseid andmeid tohib portaalis avaldada?

Lühike vastus: jah.

Korrektne vastus: jah, aga teatud tingimustel.

Mis need tingimused võiksid olla?

  1. Kõige olulisem on, et kasutajate jaoks oleks läbipaistev, mis andmed need on ja millel nad põhinevad.
  2. Läbipaistvust aitavad luua korralikud metaandmed. Kui metaandmed on põhjalikud ja korrektsed, suudab kasutaja ise hinnata andmete usaldusväärsust. Üldjuhul võib eeldada, et mida detailsem metainfo andmetega kaasas on, seda rohkem võib andmeid usaldada (väljaarvatud juhul, kui andmevaldaja on ise märkinud andmete juurde info võimalike vigade kohta – mis oleks temast ju kena).
  3. Andmete avaldajalt ei tohi röövida liigsete nõuetega soovi andmeid avaldada – seega tuleb nõuda nii vähe kui võimalik ja nii palju kui vajalik.
  4. Tasakaalu leidmiseks tuleks kokku leppida minimaalses standardses metateabes, mis peab andmetega igal juhul kaasas olema. Samuti võiks kokku leppida soovituslikes metaandmetes, mis annaksid kasutajale kasulikku infot andmete hindamiseks, kuid mille avaldamine ei ole kohustuslik. Oluline on järgida metaandmete avaldamisel alati sama struktuuri.
  5. Algandmete avaldaja peaks vastutama ainult selle eest, et tema andmetega kaasas olnud metaandmed vastavad tõele. Andmete avaldaja ei vastuta kaudsete kahjude eest, mida on teinud andmete kasutajad või nende andmete põhjal loodud tuletiste kasutajad.

Millised metaandmed võiksid andmetega igal juhul kaasas olla?

  1. Andmeallikas ja avaldaja nimi. Tuleks märkida ära allikas, kes andmestikku jagab, ning kui andmestik põhineb kellegi teise andmetel, siis ka algandmete allikas.
  2. Andmete kogumise metoodika.
  3. Andmete töötlemise metoodika.
  4. Andmete kogumise aeg.
  5. Aeg, mis hetkeseisu andmed kajastavad.

See aga ei pruugi olla piisav. Arutelu käigus tõstatus probleem elust enesest: oled ehitanud kelleltki teiselt pärit andmetele uhke teenuse, avad ühel hommikul arvuti ja… kõik on katki! Põhjuseks näiteks muudatus algandmete kogumise metoodikas, uuendamissageduses või andmete tehnilises koosseisus või hoopis mõne protsessi, põhimääruse või seaduse muutus, mistõttu andmed sellisel kujul enam ei ilmugi. Selline olukord võib tekkida muuhulgas juhul, kui andmete kogumine ja avaldamine ei tulene mitte pikaajalisest seadusega pandud kohustusest, vaid asutus avaldab andmeid omal initsiatiivil. Teisisõnu, andmepõhise teenuse pakkuja jaoks on ülioluline teada, kas ja kui kaua tema kasutatavad andmed samal kujul edasi ilmuvad. Seega oleks kasutajale suureks abiks, kui avaldaja teavitab huvilisi muudatustest andmete kättesaadavuses ette. Selleks võiks metaandmed sisaldada ka infot:

  1. Andmete uuendamissageduse või uuendamispoliitika kohta (ääremärkusena mainigem, et täna on portaalis paljudel andmetel uuendamissagedus märkimata).
  2. Andmete säilitamise tähtaeg, kui see on kehtestatud seadusega (nt kui mitu aastat andmeid säilitatakse enne arhiivi liigutamist).

See kõik on ehk isegi tehtav, kui andmehulga avaldajaks on algandmete valdaja. Kust aga võtta see info teiseste, st töödeldud või vahendatud andmete puhul? Ning mis saab, kui algandmete valdaja tegelikult ise andmete avaldamist ei sooviks? Kas tingimuseks tuleks seada, et üles laadida tohib vaid andmeid, mille algandmetele on andmevaldaja juba juurde pannud konkreetse litsentsi? Mis siis, kui litsentsi ei ole?

Need ja veel mitmed küsimused foorumil lahendust ei saanud, nii et siin, head lugejad, kutsume teid GitHubis kaasa mõtlema! Selle põhjal on plaanis edaspidi vormida konkreetne juhend, mis märgib ära andmete avaldaja kohustused ja piiritleb avaldajate, vahendajate ja kasutajate vastutuse.

Avaandmete portaali sisustatakse Euroopa Liidu struktuuritoetuse toetusskeemist "Infoühiskonna teadlikkuse tõstmine", mida rahastab Euroopa Regionaalarengu Fond.