Správa dat a FAIR principy
Správa dat
Správa výzkumných dat je široký pojem, který zahrnuje všechny postupy a činnosti, které mají zajistit, aby výzkumná data byla bezpečná, udržitelná a snadno nalezitelná, pochopitelná a (znovu)použitelná nejen během výzkumného projektu, ale i v dlouhodobém horizontu.
Plán správy dat je strategický dokument, který popisuje přístup a postupy pro správu dat během plnění grantu nebo pro tým. Jedná se o plánovaný rámec, který určuje, jak budou data sbírána, ukládána, zpracovávána, chráněna a využívána. Plán správy dat stanovuje zásady, postupy a odpovědnosti týkající se správy dat, a slouží jako základní příručka pro všechny členy týmu, kteří pracují s daty. Je to živý dokument, který se v průběhu výzkumu pravidelně aktualizuje, aby odrážel to, co se s daty skutečně děje.
Plán správy dat obecně zahrnuje několik klíčových aspektů:
- Sběr dat: Stanovuje procesy a metody pro sběr dat, včetně zdrojů, frekvence sběru a požadované kvality dat.
- Ukládání dat: Definuje způsoby a místa, kde budou data ukládána, a zajišťuje jejich dostupnost a integritu.
- Zpracování dat: Popisuje metody a nástroje pro zpracování dat, včetně transformace, analýzy a přípravy dat pro použití.
- Zabezpečení dat: Určuje opatření a postupy pro ochranu dat před neoprávněným přístupem, ztrátou nebo poškozením.
- Kvalita dat: Definuje standardy a procesy pro zajištění kvality dat, včetně kontroly integritu, validace a čištění dat.
- Správa metadat: Popisuje způsoby, jak se budou metadat spravovat, což jsou informace o datech, jako je jejich význam, struktura a vztahy s jinými daty.
- Dostupnost a sdílení dat: Stanovuje pravidla a postupy pro přístup k datům a jejich sdílení v rámci organizace, včetně oprávnění a způsobů sdílení.
Plán správy dat je důležitým nástrojem pro zajištění toho, aby byla data spravována efektivně, bezpečně a konzistentně. Pomáhá minimalizovat rizika spojená se správou dat a zvyšuje hodnotu dat. Někteří poskytovatelé mají specifické šablony pro plán správy dat (napč. Horizon Europe DMP template), a existuje několik nástrojů které umožňují nebo dokonci i zjednodušují vyplňování těchto šablon. VŠCHT Praha má k dispozici vlastní instanci DSW - Data Stewardship Wizard.
FAIR principy
FAIR jsou hlavní zásady pro vytváření a dokumentování dat a dalších výstupů (včetně metadat): nalezitelnost (Findability), přístupnost (Accesibility), interoperabilitu (Interoperbility) a opakované použití (Reusability). Tyto principy jsou nastaveny tak, aby byli splňeny jak pro člověka (“Human readable”) tak strojově zpracovatelné (“Machine actionable”)
- Dohledatelnost - metadata a data by měla být snadno nalezitelná pro lidi i počítače (strojově čitelná metadata jsou nezbytná pro automatické vyhledávání datových souborů a služeb). Pro otevřené sdílení musí být data v důvěryhodném úložišti (ne jen na webových stránkách!), včetně bohatých metadat s trvalými identifikátory a dobře popsaná. Např. obecný repozitář Zenodo poskytuje datovým souborům DOI, digitální identifikátor objektu.
- Přístupnost - jakmile uživatel najde požadovaný soubor dat, musí mít možnost k němu skutečně přistupovat (případně pomocí autentizace a autorizace). Je tedy třeba vědět kdo bude mít přístup k datům v datovém úložišti? Kdy budou data přístupná (okamžitě nebo po uplynutí doby embarga)?
- Interoperabilita - data jsou interoperabilní díky používání společných datových formátů, oborových standardů. Tedy data musí být v otevřených formátech, podle standardů pro konkrétní obor (pokud takové standardy existují). V některých oborech existují ontologické slovníky které umožňují používání zavedených termínů (uveďte je, pokud je to váš případ).
- Opakované použití - aby bylo možné data opakovaně použít, měla by být metadata a data dobře popsána, aby je bylo možné replikovat a/nebo kombinovat v různých prostředích. Data v repozitáři jsou poskytována pod licencí (např. Creative Commons CC BY). Ideálně k datům existují bohatá metadata popisující to proč a jak byly údaje získány, kde, kdy a kým byly shromážděny.
Jednotlivé FAIR principy nemají metriku splňuje/nesplňuje, ale spíše na kolik jsou splněny.