FAIR-periaatteet

Yksi dataintensiivisen tieteen haasteista on helpottaa tietämyksen jakamista. On tärkeää, että ihmiset ja tietojärjestelmät voivat löytää, saada käyttöönsä, analysoida ja yhdistellä kulloinkin käsillä olevaan tehtävään soveltuvaa tieteellistä dataa.

FAIR-periaatteiden tarkoitus on tehdä data

  • löydettäväksi (Findable),
  • saavutettavaksi (Accessible),
  • yhteentoimivaksi (Interoperable) ja
  • uudelleenkäytettäväksi (Re-usable).

FAIR-periaatteet julkaistiin vuonna 2016. FAIR-periaatteiden noudattamisesta on EU:n neuvoston linjaus vuodelta 2016. Opetus- ja kulttuuriministeriö on sitoutunut FAIR-periaatteisiin. Fairdata-palveluita kehitetään näiden periaatteiden pohjalta.

 

Findable – löydettävä


1. Resurssille annetaan ainutkertainen ja ikuisesti pysyvä tunnus (persistent identifier, PID).

  • Jotta kaksi resurssia ei saisi samaa tunnusta, täytyy tunnuksien antamisen olla standardoitua ja hyvin hallittua. Tutkimusdatan ja tieteellisten julkaisujen alalla käytetyimpiä ovat DOI-, URN– ja Handle-tunnusjärjestelmät.
  • Pysyvyys edellyttää, että sekä tunnusten että resurssien hallinta on kestävästi järjestetty. Resurssilla täytyy olla ylläpitäjä, joka huolehtii siitä, ettei se katoa verkosta ja että tunnus osoittaa aina oikeaan resurssiin.

2. Resurssille annetaan kattavat metatiedot.

  • Kuvaileva metatieto kuvaa resurssin sisältöä ja luonnetta.
  • Hallinnollinen metatieto sisältää hallinnolliset ja tekniset tiedot, esimerkiksi tutkimusaineiston käyttöehdot ja käytössä tarvittavat tekniset tiedot.
  • Rakenteellinen metatieto kuvaa resurssin rakenteen, esimerkiksi tiedostojen suhteen toisiinsa.

3. Resurssi kuvaillaan ja rekisteröidään hakupalveluun.

  • Hakupalvelut voivat olla mm. organisaatiokohtaisia, tieteenalakohtaisia tai kansallisia.
  • Usealla tieteenalalla käytetään sen erityispiirteet huomioon ottavia metatietomalleja. Nämä metatietomallit ohjaavat sitä, mitä metatietoja ja missä täsmällisessä muodossa  esim. tutkimusaineiston kuvailussa vaaditaan. Metatietomalli voi olla myös yleispätevä.

4. Pysyvä tunniste käy ilmi metatiedoista.

  • Viittauksen tulisi aina sisältää viitattavan resurssin pysyvä tunniste.

 

Accessible – saavutettava


1. Resurssi tai sen metatiedot ovat noudettavissa tunnisteen avulla standardia yhteyskäytäntöä noudattaen.

  • Kaikki aineistot eivät voi olla avoimia esimerkiksi tutkimuseettisistä syistä.  Pyrkimyksenä on, että tutkimusaineistot ovat niin avoimia kuin mahdollista ja niin suljettuja kuin on tarpeellista.

2. Yhteyskäytäntö on avoin, maksuton ja yleisesti käyttöön otettavissa.

  • Saavutettavuuden ei tulisi edellyttää esim. maksullisten ohjelmistojen käyttöä.

3. Yhteyskäytäntö tukee tunnistautumista ja valtuuttamista, kun se on tarpeen.

  • Kaikki aineistot eivät voi olla avoimesti saatavilla. Aineistojen saavutettavuutta voi silti parantaa esimerkiksi sillä, että käyttöluvan anominen ja myöntäminen on helppoa.

4. Metatiedot ovat saavutettavia, vaikka aineisto ei enää ole.

  • Metatietojen tulee olla sellaisia, että ne voidaan pitää avoimesti saatavilla, myös sen jälkeen kun itse aineisto poistetaan.

 

Interoperable – yhteentoimiva


1. Resurssin ja sen metatiedon sisältö esitetään määrämuotoista, monikäyttöistä, saatavilla olevaa ja jaettua kieltä käyttäen.

  • Aineiston tulisi olla sekä ihmis- että koneluettavaa.
  • Tietosisältöjä täytyy voida siirtää järjestelmien välillä.

2. Resurssissa ja sen metatiedoissa käytetään sanastoja, jotka noudattavat FAIR-periaatteita.

  • Suosi olemassa olevia, avoimia ja koneluettavia sanastoja, ontologioita ja koodistoja.

3. Resurssissa ja sen metatiedoissa on tyypiteltyjä viittauksia muihin resursseihin.

  • Tyypittely tarkoittaa, että viittauksen luonne on määritelty; esim. A on B:n aiempi versio tai B on käyttänyt A:ta lähteenä.
  • Pysyvien tunnisteiden käytöllä voidaan turvata viittausten kestävyys pitkällä aikavälillä.

 

Re-usable – uudelleenkäytettävä


1. Resurssille on annettu runsaasti tarkkoja ja hyödyllisiä attribuutteja.

  • Kattavat metatiedot edistävät löydettävyyttä. Niiden tulee myös auttaa arvioimaan, onko resurssi varmasti käyttökelpoinen tietyssä asiayhteydessä. Metatiedon tulisi siksi sisältää tietoja mm. tietojen keruutavasta, tunnetuista virhelähteistä yms.

2. Resurssi ja sen metatiedot on julkaistu käyttäen selkeää käyttölisenssiä, jonka ehdot ovat saatavilla.

  • Lisenssi/käyttöehdot ovat tärkeä metatieto. Epäselvät käytön ehdot saattavat estää uudelleenkäytön. Koneluettava formaatti kuten CC-lisenssi on suositeltava.

3. Resurssi on aina yhdistettävissä alkuperäänsä ja elinkaareensa.

  • Uudelleen käyttäjän pitäisi tietää, mistä tietoaineisto on tullut ja keneen sitä käyttäessä tulee viitata.
  • Myös syntyprosessin kuvailu on tärkeää: kuka ja miten keräsi aineistoa; miten sitä käsiteltiin; mitä julkaisuja siitä on tuotettu; onko siinä hyödynnetty muita datan lähteitä.

4. Aineisto täyttää oman alansa tiedeyhteisön vaatimukset.

  • Noudata tieteenalasi hyviä käytäntöjä ja kansallisia sekä kansainvälisiä ohjeistuksia