Fair(y)data käyttäjätarina

Tämä käyttäjätarina julkaistiin alun perin englanniksi MetaX-blogissa maaliskuussa 2018. Tuolloin tarinalla kuvattiin Fairdata-kokonaisuuden tavoitetilaa. Nyt tarinan kuvaamat toiminnot ovat tuotannossa ja käytössä. Alla hieman päivitetty käyttäjätarina uusintajulkaisuna.

Olipa kerran…

1. Kolme viisasta tutkijaa Turun ja Tampereen yliopistosta sekä Jyväskylän ammattikorkeakoulusta ovat keränneet hämmästyttävää dataa eräästä tietystä varpusia kiusaavasta lintukirppulajista. He (tutkijat, eivät kirput) ovat nyt viimeistelemässä julkaisuaan ja haluavat liittää artikkeliinsa viitteen tutkimusdataan, jotta se saa ansaitsemansa näkyvyyden. Tämän vuoksi he tarvitsevat tutkimusaineistolleen pysyvän tunnisteen.

Tutkijoilla on yhteinen säilytystila IDA-palvelussa ja he käyttävät IDAn valmistelualuetta datansa keräämiseen. Valmistelualueella heillä kaikilla on yhtäläiset oikeudet muokata palvelussa olevaa dataa. Jokainen tutkijoista noudattaa yhdessä sovittuja hyviä käytäntöjä tiedostojen nimeämisessä ja kansiorakenteiden luomisessa, jotta he kaikki tietävät missä mikäkin tiedosto sijaitsee.

Hyvistä käytännöistä huolimatta tutkijoista tuntuu, että data pitäisi järjestellä vielä kertaalleen ennen sen julkaisemista. Ei hätää: valmistelualueella kaikilla projektin jäsenillä on oikeus nimetä tiedostoja ja kansioita uudelleen ja siirtää tiedostoja kansiosta toiseen. Niinpä tutkijat järjestävät datan yhden juurikansion sisään valmistelualueelle. Datan rakenne ja tiedostonimet näyttävät nyt hyviltä, joten yksi tutkijoista valitsee valmiin datan juurikansion ja klikkaa IDAssa painiketta, jossa lukee ”Jäädytä”.

Kuva: Dollar Gill / Unsplash

2. Jäädyttämistoiminto siirtää kaiken kyseisen kansion alla olevan datan projektin jäädytetylle alueelle IDAssa ja muuttaa sen read only-tilaan. Samalla tiedostojen tekninen metatieto tallentuu Metaxiin taustaoperaationa. Tämä metatiedon tallennus tekee tiedostot näkyviksi muille palveluille Fairdata-kokonaisuudessa. Kaksi muuta tutkijaa menevät tarkistamaan tiedostot projektin jäädytetyllä alueella ja lataavat ne IDAsta omalle koneelleen. He näkevät, että kyseessä on datan lopulliseksi sovittu versio. Data on nyt valmista julkaisemista varten. Jihuu!

3. Yksi tutkijoista kirjautuu Qvain-työkaluun. Kyseessä on työkalu, jolla hän voi luoda tarvittavat metatiedot julkaistavaan tutkimusaineistoon. Hän täyttää vaaditut kentät ja liittää myös paikkatiedot niistä kohteista, jossa data on kerätty. ”Onpas näppärää”, hän miettii ja siirtyy viimeiseksi Qvaimen ”Files”-valikkoon.

4. Tutkija näkee nyt tiedostonäkymän, joka näyttää samalta kuin IDAn tallennustila. IDAsta poiketen hän kuitenkin näkee ainoastaan projektin jäädytetyn datan. Ne tiedostot, jotka tutkijat ovat tallentaneet ainoastaan valmistelualueelle eivät ole näkyvissä. Kyseessä ei oikeastaan ole näkymä IDA-palveluun, vaan Qvain näyttää sitä tiedostometatietoa (tiedostopolku, nimi, tiedostokoko jne…), joka tallentui Metaxiin silloin kun tiedosto jäädytettiin IDAssa. Tutkija valitsee jäädytetyn datan juurikansion, mikä automaattisesti valitsee kaikki tiedostot ja alihakemistot sen alla. Tutkija on aiemmin valinnut Qvaimen ”Rights and Licenses”-välilehdellä kohtaan ”Access type” vaihtoehdon ”Open”. Tämä tarkoittaa sitä, että kun työn alla oleva tutkimusaineisto on julkaistu, kuka vain julkaistua tutkimusaineistoa katseleva voi ladata siihen linkitetyt tiedostot omalle koneelleen.

5. Tutkija jää pohtimaan tutkimusaineiston lisenssin valintaa. Hän klikkaa Qvaimessa ”Save” (ei siis ”Publish”), jolloin aineiston kuvailusta tallentuu paikallinen kopio Qvaimeen. Hän juttelee kollegalleen lisenssiasiasta. Kollega kertoo hänelle, että Qvaimen oletuslisenssi CC-BY-4.0 on hyvä ja suositeltu lisenssi tutkimusaineistolle.

6. Tutkija on nyt tyytyväinen tutkimusaineistokuvailuun, joten hän painaa Qvaimessa ”Publish”. Hänelle näytetään linkki Etsin-palveluun, jossa hän voi katsella julkaisemaansa tutkimusaineistoa. Taustalla on tapahtunut muutakin: tutkimusaineiston metatieto ja sen sisältämät linkit IDA-tiedostojen metatietoihin on nyt tallennettu Metaxiin. Etsin oikeastaan vain näyttää Metaxiin tallennettua metatietoa. Etsin, tai mikään muukaan palvelu IDAn lisäksi, ei kuitenkaan näytä metatietoja niistä jäädytetyistä IDA-tiedostoista, joita ei ole linkitetty tutkimusaineistoihin. Ne ovat vain IDAa käyttävän projektiryhmän saatavilla.

7. Tutkija klikkaa Qvaimessa linkkiä, joka vie hänet Etsimeen. Hän näkee sivun, jota kutsutaan tutkimusaineiston kuvailusivuksi. Sivu näyttää sen metatiedon ja ne tiedostolinkit, jotka tutkija loi Qvaimella. Tiedostotietojen vieressä on nappi, jossa lukee ”Download all”. Tutkija klikkaa tätä nappia, jolloin hänen selaimensa lataa tutkimusaineistoon linkitetyt tiedostot. Samalla kun tutkija painoi latausnappia, sai Metax kyselyn liittyen kyseiseen tutkimusaineistoon ja sen tiedostoihin. Kysely tarkistaa, että tiedostot ovat varmasti osa tutkimusaineistoa ja että aineisto on määritetty avoimesti ladattavaksi. Jos tarkistukset ovat ok, kertoo Metax Fairdatan latauskomponentille, että tiedostolataus voi alkaa.

8. Tutkija näkee, että kuka tahansa voi ladata tutkimusaineiston tiedostot koneelleen ja näkevän miten tutkimusaineistoa voi käyttää ja miten siihen viitataan. Hienoa!