Ajankohtaista

Tilannetiedotus Fairdata-kokonaisuuden käyttöönotosta

Hyvään tieteelliseen käytäntöön kuuluu tutkimuksessa tuotetuista tietoaineistoista huolehtiminen. Fairdata-kokonaisuus varmistaa tutkimuksen todennettavuuden ja toistettavuuden, sekä turvaa tietoaineistojen pitkäaikaisen saatavuuden. Fairdata-kokonaisuus tukee omalta osaltaan tulevan Datanhallinnan ja laskennan kehittämisohjelman tavoitteita. Kokonaisuus koostuu seuraavista osapalveluista:

IDA – Tutkimusdatan säilytyspalvelu mahdollistaa tutkimusdatan turvallisen säilytyksen.

Etsin – Tutkimusaineistojen hakupalvelu sisältää tutkimusaineistoja kuvailevia tietoja eli metatietoja. Etsimen avulla voi etsiä tutkimusaineistoja käyttöön.

Qvain – tutkimusaineistojen kuvailutyökalu auttaa oikean ja riittävän kuvailutiedon liittämisen aineistoon. Tarkka metadata mahdollistaa aineiston löydettävyyden ja varmistaa Fairdata-palveluiden yhteentoimivuuden.

Fairdata PAS -palvelu huolehtii tutkimusaineistojen pitkäaikaissäilytyksestä. Pitkäaikaissäilytys tarkoittaa datan säilyttämistä ja luettavana pitämistä kymmenien tai satojen vuosien ajan.

IDA ja Etsin ovat käytössä. Qvain-käyttöönotto on viivästynyt,  ja se otetaan käyttöön vuoden 2019 alussa. Tämä vaikuttaa Etsimen uuden version sekä Fairdata PAS -palvelun käyttöönottoon. Nämä voidaan ottaa käyttöön, kun Qvain on toiminnassa vuoden 2019 tammikuussa. Nyt siirtymävaiheessa IDAssa olevia tiedostoja ei voi linkittää aineistokuvailuihin Etsimessä, mutta niitä voi jakaa väliaikaisin jakolinkein. Metatietovaranto Metaxin rajapinta avataan marraskuun aikana myös yksittäisille loppukäyttäjille, jolloin sitä kautta voi luoda aineistoja myös tiedostolinkityksineen.

Lisätietoja aiheesta:

Qvain: Esa-Pekka Keskitalo, esa-pekka.keskitalo@helsinki.fi

Muut Fairdata-palvelut: Anssi Kainulainen, anssi.kainulainen@csc.fi

Tuen ja osaamisen yhteistyön kehittäminen

Perjantaina 26.10. yli kaksikymmentä tutkimusorganisaatioiden IDA- ja Fairdata-yhteyshenkilöä kokoontui CSC:lle kuulemaan uudistuneesta Fairdata-palvelukokonaisuudesta, sen toiminnallisuuksista ja koko palvelukokonaisuuden käyttöönoton aikatauluista.

Jessica Parland-von Essen kertoi miten Fairdata-palveluiden avulla on helpompi huolehtia aineistoista ja toteuttaa FAIR-periaatteita. Lisäksi näimme koosteen erilaisista tutkimuksen tuen malleista, joihin eri tutkimusorganisaatioissa on päädytty.

Anssi Kainulainen esitti kokonaiskuvan uudistuvasta palvelukokonaisuudesta. Fairdata-kokonaisuus koostuu palveluista, jotka tukevat aineistojen löydettävyyttä, säilyttämistä ja hallintaa. Erilliset, mutta keskenään yhteentoimivat palvelut on tarkoitettu aineistonhallintaan, aineistojen kuvailuun ja turvalliseen säilytykseen sekä merkittävien tietoaineistojen pitkäaikaissaatavuuden turvaamiseen.

Fairdata PAS-sopimusten tilannekuvauksen antoi Pirjo-Leena Forsström. Kattavampi sopimusuudistus on tarkoitus tehdä vuonna 2019 ja tästä järjestetään erillinen tiedotustilaisuus joulukuussa 2018.

Iltapäivällä oli mahdollisuus osallistua työpajaan, jossa keskusteltiin tuen ja osaamisen yhteistyön kehittämisestä pääasiassa CSC:n tuottamiin palveluihin liittyen.

Keskustelu oli vilkasta ja ilmeni, että organisaatioissa ollaan valmiita kertomaan Fairdata-palveluista. Datanhallinnasta jaetaan tietoa organisaatioiden aineostonhallinnan oppaissa ja koulutuksissa. Organisaatioissa toivotaan, että tietoa palveluista löytyisi yhdestä paikasta kootusti. Toiveina esitettiin mm. videomuotoista materiaalia päivittyvinä videosarjoina, jolloin kukin voisi katsoa sen osan, johon sillä hetkellä on tarvetta. Lisäksi toivottiin valmiita ppt-esityksiä sekä eritasoisia kuvallisia käyttöoppaita verkkoon. Myös tukihenkilöt itse toivoivat heille suunnattua materiaalia, esim. webinaari- ja FAQ-muodossa. Palvelujen käytön tilastojen katseluun ja käytön hallintaan toivottiin avuksi palveluportaalia.

Haastavaksi organisaatioiden tukihenkilöt kokivat mm. sen, että kaikki projektit ovat erilaisia ja tutkimusryhmien johtajat ovat kiireisiä, mikä tuottaa datanhallinnan tuelle paljon työtä. Aineistoihin liittyvät sopimusasiat koettiin myös haasteellisiksi ja niihin toivottiin valmiita sopimuspohjia yhteiselle alustalle. Organisaatioissa on koettu hyväksi käytännöksi IT-puolen ja kirjaston yhteistyö, joka näkyy myös tutkijalle sujuvampana palveluna. Yhteyshenkilöt pitivät tärkeänä yhdistää CSC:n tuottamat palvelut oman organisaationsa palvelutarjoomaan. Pohdimme myös sitä, miten CSC:hen yhteyttä ottanut tutkija voitaisi ohjata tarvittaessa ottamaan yhteyttä myös oman organisaationsa datatukeen. Yhteenvetona työpajasta jäi kuva, että yhteistyötä kaivataan sekä CSC – tutkimusorganisaatio ‑akselilla että vertaistukea tutkimusorganisaatioiden kesken.

Iltapäivän toisessa työpajassa käytiin läpi Metaxin rakennetta ja mahdollisia tietovirtoja/rajapintojen käyttötapauksia. Työpajasta voit lukea kuvauksen täältä.

Millainen on uudistunut IDA?

IDA on opetus- ja kulttuuriministeriön järjestämä turvallinen ja jatkuva Fairdata-kokonaisuuteen kuuluva palvelu. Palvelu on tarkoitettu tutkimusaineistoihin liittyvän datan säilytykseen ja jakamiseen. IDAan tallennettu data voidaan kuvailla, julkaista ja avata muiden ladattavaksi muilla Fairdata-kokonaisuuteen kuuluvilla palveluilla.

IDA tarjoaa projektikohtaista säilytystilaa tutkimusdatalle

Fairdata-kokonaisuuteen kuuluva IDA-säilytyspalvelu tarjoaa määritellylle käyttäjäryhmälle yhteistä säilytystilaa tutkimusdatalle. IDAn käyttäjä kuuluu aina johonkin IDAa käyttävään projektiin. Samassa IDAa käyttävässä projektissa voi olla jäseniä useista eri korkeakouluista tai tutkimusorganisaatioista. Projektilla on vastuuhenkilö, joka vastaa jäsenten projektiin liittämisestä ja poistamisesta. Projektin aineistoista ja niiden käytöstä on tärkeä sopia jo projektia perustettaessa. Kaikilla projektin jäsenillä on yhtäläiset tekniset oikeudet lisätä, poistaa ja tehdä toimenpiteitä kaikelle sille projektin datalle, joka on tallennettu projektin IDA-tilaan.

IDA on suunniteltu tiedostojen säilytykseen, ei niiden aktiiviseen käsittelyyn. Käyttäjät eivät voi siis muokata IDAssa olevien tiedostojen sisältöä niiden ollessa palvelun sisällä. IDA ei myöskään ole tarkoitettu salassapidettävän datan, kuten arkaluonteisten henkilötietojen säilytykseen.

Uudistunut IDA on yhteentoimiva muiden Fairdata-palvelujen kanssa

IDAn palvelu-uudistuksen myötä sen käyttöliittymät ovat uudistuneet kesällä 2018. IDAa voi nyt käyttää helppokäyttöisen selainkäyttöliittymän lisäksi komentorivityökaluin. Uusi selainkäyttöliittymä sisältää myös ohjeita palvelun käyttöön. Palvelun verkkosivuilta löytyy myös kattava palvelun käyttöopas ja ohjeet IDA-tilan hakemiseen.

IDA soveltuu tutkimusvaiheen aikaiseen datan tallettamiseen, sen jakamiseen käyttäjäryhmän kesken, sen säilyttämiseen muuttumattomassa tilassa sekä sen julkaisuun. Data, jonka käyttäjä on merkinnyt säilytettäväksi muuttumattomassa tilassa eli jäädyttänyt IDAssa, voidaan julkaista muilla Fairdata-kokonaisuuteen kuuluvilla palveluilla. Ennen julkaisemista jäädytetylle datalle lisätään kuvailutietoja Qvain-palvelussa. Qvaimella julkaistu aineisto saa pysyvän tunnisteen ja kuvailusivun. Näin aineisto on löydettävissä Etsin-hakupalvelusta. Julkaistun tutkimusaineiston tiedostot voidaan asettaa muiden ladattavaksi avoimesti tai käyttöluvalla, tai aineistosta voidaan julkaista vain metadata.

IDA on yksi väylä aineiston viemiseksi säilytykseen Fairdata PAS -palveluun

Tutkimusaineistojen pitkäaikaissäilytys Fairdata PAS (http://digitalpreservation.fi/) on IDAsta erillinen palvelu, vaikka IDAlla on monia samoja ominaisuuksia. IDA tarjoaa bittitason säilytystä. Pitkäaikaissäilytys taas tähtää datan säilyttämiseen periaatteessa ikuisesti ja voi tehdä myös teknologisia muutoksia, jotta datan ymmärrettävyys säilyy pitkällä aikavälillä. IDA on integroitu Fairdata PAS -palveluun niin, että IDAssa säilytettävät ja Qvaimella kuvaillut aineistot on mahdollista siirtää säilytettäväksi Fairdata PAS -palveluun.

Video tutustuttaa IDAn keskeisiin ominaisuuksiin

Yllä oleva IDAn esittelyvideon toinen osa tutustuttaa palvelun tärkeimpiin ominaisuuksiin. Alta löydät videon ohjeet tekstimuodossa. Lisätietoa löydät IDAn pikaoppaasta ja käyttöoppaasta. Jos jokin jää askarruttamaan, ota yhteyttä asiakaspalvelu (a) csc.fi.

Käyttöönotto ja kirjautuminen

  • Kun tutkimusryhmä on sopinut kuka on projektin vastuuhenkilö, vastuuhenkilö luo itselleen CSC-tunnuksen ja projektin CSC:n asiakasportaalissa.
  • Tilaa haetaan sähköisellä hakemuksella, joka löytyy myös CSC:n asiakasportaalista. Hakemuksen käsittelee ja tilan myöntää oma organisaatio tai sen voi saada Suomen Akatemian rahoituspäätökseen perustuen. Projektin vastuuhenkilö voi kutsua IDA-projektiinsa muita jäseniä, ja myös heidän on luotava itselleen CSC-tunnus.
  • IDAn selainkäyttöliittymä löytyy osoitteesta ida.fairdata.fi.
  • Voit kirjautua IDAan CSC-tunnuksellasi tai Hakalla.

Datan tallennus

  • Kirjauduttuasi palveluun näet projektikansiot niille projekteille, joiden jäsen olet. Jokaisella projektilla on kaksi kansiota, toinen tiedostojen palveluun tuomiseen ja järjestelyyn ja toinen datan säilyttämiseen muuttumattomassa tilassa.
  • Dataa lisätään aina siihen kansioon joka päättyy +merkkiin. Se on projektisi valmistelualue. Sen jälkeen kun tuon kansion on napsauttanut auki, voi dataa lisätä joko yläreunan plus-ikonin kautta tai yksinkertaisesti pudottamalla dataa selainikkunaan drag and drop -toiminnolla. Näin palveluun voi siirtää kokonaisia kansioita sisältöineen.
  • Toinen tapa siirtää palveluun koko kansion sisältö on luoda + merkin takaa uusi kansio ja valita tiedostoselailunäkymästä esimerkiksi kaikki tiedostot painamalla crtl+a

Datan järjestely

  • Tiedostot kannattaa järjestää palvelussa kansioiden sisään, datan ymmärrettävyydelle mielekkäällä tavalla. Käytä tarkoituksenmukaisia ja uniikkeja tiedostonnimiä. Miettikää yhdessä aineistojen ja kansioiden nimeämiskäytäntöjä. Huomaa, että kun aineistot julkaistaan, tiedostojen nimistä tulee aina julkisia.
  • Jos projektin data koostuu esimerkiksi tuhansista pienistä tiedostoista, kannattaa ne paketoida eli zipata isommiksi tiedostoiksi ennen palveluun siirtämistä. Toisaalta kymmenien tai satojen gigojen kokoisten tiedostopakettien tekeminen voi myös hankaloittaa aineistojen palveluun siirtoa ja niiden käyttöä. Kannattaa miettiä minkä kokoista dataa on kätevää ladata palvelusta ulos ja muutenkin käyttää.

Datan jäädytys

  • Kun data on mielestäsi valmista säilytettäväksi palvelussa read-only-tilassa, voit jäädyttää sen valitsemalla lumihiutale-ikonin halutun tiedoston tai kansion kohdalta ja valitsemalla oikeasta reunasta ”Freeze” tai ”Jäädytä”. Näin valittu data siirtyy toiseen projektikansioosi, jonka nimi on vain projektin tunniste ilman + merkkiä. Tämän jälkeen tiedostoa ei voi enää esimerkiksi ylikirjoittaa tai siirtää toiseen kansioon.
  • Samalla palvelu tekee tiedostoille säilytystoimenpiteitä, eli mm. datasta replikan toiselle tallennusmedialle ja laskee tiedostoille tarkistussummat, joilla tiedostojen eheys ja säilyvyys voidaan varmistaa. Tämä taustaoperaatio saattaa viedä pitkään riippuen jäädytetyn datan määrästä. Prosessin etenemistä voi seurata ”Toiminnot” tai ”Actions” välilehdellä.
  • Jäädytetty data voidaan kuvailla Qvaimella ja julkaista Etsimessä, jolloin aineisto saa pysyvän tunnisteen. Julkaistu data voidaan asettaa avoimesti tai käyttöluvalla ladattavaksi, tai julkaista siitä vain metatiedot. Muista aina että pysyvä tunniste on lupaus muille tutkijoille että aineistoa ei enää muuteta vaan siihen voi turvallisesti viitata.

Miten väliaikainen jakolinkki toimii

  • Tiedostoja voi jakaa myös väliaikaisesti palvelun ulkopuolelle. Jakolinkki on voimassa määräajan, korkeintaan 30 päivää. Jakolinkki on henkilökohtainen eli muut projektin jäsenet eivät näe muiden tekemiä jakolinkkejä.
  • Jos haluat pysyvän linkin dataasi, sinun tulee kuvailla se Qvaimella ja julkaista Etsimessä, jolloin määrittelemäsi datasetin pysyvään tunnisteeseen voidaan viitata.

Mitä jäädyttäminen on

  • Huomaa, että tiedostot ovat varsinaisessa säilytyksessä IDAssa vasta kun ne on jäädytetty. Tällöin niille tehdään toimenpiteitä niiden säilyvyyden varmistamiseksi. Muilla palvelukokonaisuuteen kuuluvlla palveluilla on tieto jäädytetyistä IDA-tiedostoista ja ne voidaan siksi kuvailla kuvailutyökalulla tutkimusaineistoiksi.

Mitä tapahtuu kun palauttaa tiedoston valmistelualuelle tai poistaa sen

  • Jos palautat jäädytettyä dataa projektisi IDA-tilan valmistelualueelle, niin se peruu palvelussa tehdyt jäädytykseen liittyvät toimenpiteet. Tämä tarkoittaa myös sitä, että jos olet kuvaillut ja julkaissut jäädytettyä dataa, niin kun data palautetaan valmistelualueelle, tekemäsi aineistokuvailu menee rikki. Sille annettu pysyvä tunniste vanhenee pysyvästi ja mahdolliset aineistoon tehdyt viittaukset eivät ole enää täydellisiä, koska aineiston data ei ole enää saatavilla. Jos siis olet saanut Qvaimella kuvaillulle aineistokuvailullesi esim. URN-tunnisteen, älä tee muutoksia siihen kuuluvalle datalle IDAssa, koska aineiston hajoaminen on aina peruuttamatonta.
  • Huomaathan dataa poistaessasi, että poistettu data ei mene roskakoriin vaan poistuu palvelusta pysyvästi.

Yhteistyöllä kestävää digitaalista pitkäaikaissäilytystä

PAS-seminaari 2018 Aika: 5.11.2018, klo 9:00-17:00 Paikka: CSC – Tieteen tietotekniikan keskus, Keilaranta 14, Espoo

Kansalliset pitkäaikaissäilytyspalvelut täyttävät kolme vuotta! PAS-palveluiden kolmivuotiassyntymäpäivien kunniaksi järjestettävä seminaari on tarkoitettu kaikille digitaalisesta pitkäaikaissäilytyksestä kiinnostuneille tahoille ja erityisesti OKM:n tarjoamia PAS-palveluita hyödyntäville organisaatioille. Seminaarissa kuulet tuoreimmat kuulumiset kansallisista PAS-palveluista, kansainvälisiä näkökulmia pitkäaikaissäilytykseen eurooppalaisilta pitkäaikaissäilytyksen asiantuntijoilta ja kokemuksia kansallisten PAS-palveluiden käytöstä niitä jo hyödyntäviltä organisaatioilta.

Ohjelma ja ilmoittautuminen

Miten dataan voi viitata?

Pelkkään datatiedostoon viittaaminen lähteenä ei tieteellisessä yhteydessä ole riittävää. Tiedeyhteistön on saatava luotettavaa tietoa siitä, mistä on kyse: mistä data tulee ja miten sitä pitää tulkita? Lisäksi tarvitaan tietoa siitä, miten sitä mahdollisesti voi käyttää. Siksi sähköisistä aineistoista on tehtävä tutkimusaineisto. Tämä tarkoittaa, että se kuvaillaan asianmukaisesti ja sille hankitaan tunniste, joka on varmasti pysyvä ja uniikki. Näin aineistoon voi viitata selkeästi ja yksiselitteisesti.

Suomen Tiedeakatemioiden yhteydessä toimiva Data-asian kansalliskomitea tuottanut dataviittausohjeen kansainvälisten käytäntöjen mukaan. Viittaamisessa yksiselitteisyys on tärkeää, sillä datan kohdalla ei ole olemassa “alkuperäistä” dataa vaan ainoastaan kopioita. Data muuttuukin herkästi jälkiä jättämättä, ellei dokumentaatiota tehdä kunnolla.

Periaatteessa aineistoon viitataan samalla tavalla kuin mihin tahansa muuhun lähteeseen: tekijä, aineiston nimi, julkaisija ja julkaisuajankohta sekä pysyvä tunniste. Näistä viimeinen on tutkimusaineiston kohdalla tärkeä, koska esimerkiksi jokainen aineistoversio saa uuden tunnisteen. Lukija voi siis olla varma, että hän voi saada käsiinsä täsmälleen saman aineiston tiedot kuin viitteessä on mainittu. Muita lisätietoja voi olla esimerkiksi versionnumero, aineiston tyyppi tai käyttölisenssi.

Eli pelkkään dataan ei voi viitata. Tarvitaan metatietoa ja pysyvä tunniste, jotta viittaminen onnistuu. Fairdata-palvelut tarjoavat hyvän mahdollisuuden tehdä datasta tutkimusaineisto. Viittaus tuottaa paitsi tutkimusaineiston tekijöille meriittiä myös tutkimukselle parempaa toistettavuutta. Muista siis viitata myös omaan tutkimusaineistoosi!

Jessica Parland-von Essen

Suomen tiedeakatemiat
FRDC Data Citation Roapmap

Kuva: Marcus Quigmire / Flickr CC BY SA 2.0

Mitä on referenssidata?

Referenssidata tarkoittaa usein tutkijoille jonkinlaista viiteaineistoa, jota voi verrata omaan aineistoon. Sitä voidaan esimerkiksi käyttää testiaineistona tai normina, jota vasten muutoksia tai poikkeuksia voi mitata ja ilmaista. Referenssiaineiston avulla voidaan myös mitata jonkin laskennallisen menetelmän tehokkuutta.

Tiedonhallinnassa referenssidatalla on myös toinen merkitys. Silloin tarkoitetaan sallittujen arvojen joukkoa jossakin tietyssä yhteydessä. Tällaisia sallittuja arvoja voisivat olla esimerkiksi eri kielten koodit tai vaikkapa arvot “kyllä”, “ei” tai “en osaa sanoa”. Tällaisiin tietojärjestelmän referenssidatoihin käyttäjä käytännössä törmää useimmiten radionappi- tai alasvetovalikoissa. Niistä on hyötyä käyttäjille, koska ne usein helpottavat ja nopeuttavat oikeanlaisen tiedon viemistä järjestelmään. Aina asioiden lokeroiminen ei tietenkään ole helppoa. Valmiit, rajoitetut vastausvaihtoehdot voivat joskus olla todella ärsyttäviä, kun mikään vaihtoehdoista ei tunnu sopivalta. Usein on onneksi kuitenkin tarjolla mahdollisuus tekstin muodossa antaa täydentävää tietoa.

Tällaisesta kontrolloitujen listojen käytöstä on kuitenkin suurta hyötyä tiedon laadun kannalta. Tiedosta saadaan huomattavasti yhtenäisempää ja paremmin yhteentoimivaa, mikäli referenssidatat ja järjestelmäkokonaisuus on suunniteltu ja ylläpidetty hyvin. Käyttäjien tekemät kirjoitusvirheet ja turhat variantit jäävät pois. Mikäli vielä menemme askeleen pidemmälle, kuten Fairdata-palveluissa on tehty, arvoille lisätään kielestä riippumattomat ja globaalisti uniikit ja yhteentoimivat tunnukset. Niitä ei käyttäjien tarvitse edes nähdä, mutta koneille ne ovat karkkia, sillä niiden avulla tietoa voidaan yhdistellä eri tietojärjestelmien välillä (esimerkiksi aineistokatalogin ja kirjastoluettelon kesken) tai tietokannan sisältöä voidaan automaattisesti näyttää käyttöliittymässä eri kieliversiona. Kone pystyy hyödyntämään tietoa paljon tehokkaammin ja toimimaan sen pohjalta, kun se perustuu referenssidatoihin.

Referenssidatat ovatkin olleet Fairdata-palveluiden suunnittelussa tärkeässä roolissa. Olemme keränneet referenssidatasettejä monesta eri asiasta ja julkaisemme niitä avoimesti myös muiden palveluntarjoajien käyttöön. Tutkijat hyötyvät, kun tieto liikkuu tehokkaammin, eikä heidän tulevaisuudessa toivottavasti tarvitse yhtä usein kopioida käsin tietoa järjestelmästä toiseen. Tiedot tutkijoiden aineistosta liikkuvat avointen rajapintojen kautta sutjakkaasti myös ulkomaailmaan, kansainvälisiin tietokantoihin. Näin tutkijat ja heidän työnsä saavat parempaa näkyvyyttä.

Jessica Parland-von Essen
Kuva: OpenGridSchedler/Flickr CC0 (public domain)

Dataa täytyy kesyttää

Euroopan komission Fairdata-asiantuntijaryhmän vastikään julkaistussa väliraportissa annetaan kokonaista 14 suositusta eri tahoille tutkimusaineistojen hallinnan parantamiseksi. Suositukset on koottu neljäksi eri askeleeksi, joista ensimmäinen käsittelee määritelmien ja tavoitteiden selkeyttämistä. Toinen vaihe on ekosysteemin rakentaminen, jossa palveluiden ja infrastruktuurien luominen ovat keskeisessä roolissa. Kolmas askel koskee yhteentoimivuuden luomista ja laadun varmistamista eri tasoilla ja neljäs selkeää panostusta tiedonhallintaan, niin sen suunnitteluun kuin osaamisen ja prosessien kehittämiseen.

Olemme leikillämme puhuneet datan domestikaatiosta. Vaikka toisaalta voi olla totta, että ”informaatio haluaa olla vapaata”, on datan hyökyaalto tehnyt varsinaisen tiedon hallinnan haastavaksi. Dataa täytyy kesyttää. Siksi puhumme tutkimuksen tietoaineistoista emmekä vain datasta. Data vaati metadataa, dokumentaatiota ja kuratointia kelvatakseen lähteeksi tai uudelleen käytettäväksi. Tutkimusaineisto on paljon enemmän kuin kasa bittejä.

Tutkijan on kuitenkin itse mahdoton toteuttaa tietojärjestelmien pitkäjänteistä ylläpitoa ja kehitystä varsinaisen tutkimuksensa ohella. Yhteentoimivuus ja tutkimuksen toistettavuuden varmistaminen vaativat kehittynyttä teknologiaa ja laajaa tiedonhallinan ymmärrystä. Siksi tarvitaan tutkimukselle omia palveluita, jotka tukevat reilun datan syntymistä. Fairdata-kokonaisuus on rakennettu tämän ajatuksen pohjalta. Aineiston luotettava säilytys ja hallinnointi yhdistyy metatiedon avoimuuteen ja pysyvien tunnisteiden tehokkaaseen käyttöön. Kokonaisuus ei vielä ole valmis, jos mikään nyt koskaan on valmista edes tämän päivän maailmassa. Kokonaisuus on kuitenkin jo nyt joustava ja hyvin skaalautuva, samalla kun se vahvasti tukee yhteentoimivuutta ja pysyvyyttä.

Jessica Parland-von Essen, Ph.D.
Kuva: Janneke Staaks / Flickr CC 2.0 BY NC

Datan elinkaaresta ja Fair-periaatteista

Julkaisujen avoimuutta on edistetty korkeakouluissa enemmän ja vähemmän aktiivisesti jo useamman vuoden ajan. Nyt katseet kääntyvät vähitellen kohti tutkimuksessa syntyvää dataa. Kuinka jatkossa huomioimme syntyvän datan keräämisen, kuvailun ja säilytyksen?

Kansalliskirjasto järjesti datan elinkaareen ja sen avoimuuteen liittyvän seminaarin huhtikuussa 2018. Seminaarin tavoitteena oli pureutua datan elinkaaren eri vaiheisiin ja tähän liittyen Fairdata-periaatteisiin, sekä tutustua kansalliseen Fairdata-palvelukokonaisuuteen.

Tutustu Terhi Kaipaisen kirjoittamaan artikkeliin ammattikorkeakoulukirjastojen Kreodi-verkkolehdessä.