Miten dataan voi viitata?

Pelkkään datatiedostoon viittaaminen lähteenä ei tieteellisessä yhteydessä ole riittävää. Tiedeyhteistön on saatava luotettavaa tietoa siitä, mistä on kyse: mistä data tulee ja miten sitä pitää tulkita? Lisäksi tarvitaan tietoa siitä, miten sitä mahdollisesti voi käyttää. Siksi sähköisistä aineistoista on tehtävä tutkimusaineisto. Tämä tarkoittaa, että se kuvaillaan asianmukaisesti ja sille hankitaan tunniste, joka on varmasti pysyvä ja uniikki. Näin aineistoon voi viitata selkeästi ja yksiselitteisesti.

Suomen Tiedeakatemioiden yhteydessä toimiva Data-asian kansalliskomitea tuottanut dataviittausohjeen kansainvälisten käytäntöjen mukaan. Viittaamisessa yksiselitteisyys on tärkeää, sillä datan kohdalla ei ole olemassa “alkuperäistä” dataa vaan ainoastaan kopioita. Data muuttuukin herkästi jälkiä jättämättä, ellei dokumentaatiota tehdä kunnolla.

Periaatteessa aineistoon viitataan samalla tavalla kuin mihin tahansa muuhun lähteeseen: tekijä, aineiston nimi, julkaisija ja julkaisuajankohta sekä pysyvä tunniste. Näistä viimeinen on tutkimusaineiston kohdalla tärkeä, koska esimerkiksi jokainen aineistoversio saa uuden tunnisteen. Lukija voi siis olla varma, että hän voi saada käsiinsä täsmälleen saman aineiston tiedot kuin viitteessä on mainittu. Muita lisätietoja voi olla esimerkiksi versionnumero, aineiston tyyppi tai käyttölisenssi.

Eli pelkkään dataan ei voi viitata. Tarvitaan metatietoa ja pysyvä tunniste, jotta viittaminen onnistuu. Fairdata-palvelut tarjoavat hyvän mahdollisuuden tehdä datasta tutkimusaineisto. Viittaus tuottaa paitsi tutkimusaineiston tekijöille meriittiä myös tutkimukselle parempaa toistettavuutta. Muista siis viitata myös omaan tutkimusaineistoosi!

Jessica Parland-von Essen

Suomen tiedeakatemiat
FRDC Data Citation Roapmap

Kuva: Marcus Quigmire / Flickr CC BY SA 2.0