Dane badawcze
Dane badawcze powstałe w trakcie badań finansowanych ze środków publicznych na mocy przyjęcia przez Parlament Europejski Radę (UE) Dyrektywy w sprawie otwartych danych i ponownego wykorzystywania informacji sektora publicznego (2019/1024) w czerwcu 2019, zostały włączone do danych sektora publicznego, a tym samym podlegają m.in. obowiązkowi otwartego udostępniania. Wiele instytucji finansujących projekty badawcze wymaga przygotowania stosownego planu zarządzania danymi badawczymi. Plan Zarządzania Danymi (PZD) ma za zadanie przedstawić zagadnienia związane z wytworzeniem lub pozyskaniem danych, formaty plików, w których dane zostaną zapisane, omówić przechowywanie danych, sposób dostępu do danych i informacje o ich ponownym wykorzystaniu, przedstawić aspekty prawne i etyczne udostępniania danych, kwestie finansowe, infrastrukturalne i kompetencyjne planowanego przedsięwzięcia naukowego. Narodowe Centrum Nauki jest pierwszą polską instytucją, która PZD wprowadziła do swoich konkursów i uczyniła obowiązkowym elementem wniosku grantowego. Omówienie poszczególnych punktów Planu znajduje się poniżej.
Dla Pracowników naukowych Politechniki Bydgoskiej chcących ubiegać się o środki na projekty badawcze, m.in. z Narodowego Centrum Nauki, przygotowaliśmy pomoc w postaci formatek PZD. Formatki w wersji angielskiej oraz polskiej dostępne w sieci wewnętrznej PBŚ.
UWAGA! Formatka PZD musi być dostosowana indywidualnie do projektu. Odpowiedzi na kolejne pytania zależą m.in. od charakteru badań, rodzaju danych, wymogów instytucji finansującej badania, wymogów prawnych.
Konsultacje w sprawie sporządzania PZD prowadzi Centrum Nauki
Kontakt: nauka@pbs.edu.pl
Koordynatorzy wydziałowi ds. danych badawczych:
- WHiBZ - prof. dr hab. inż. Dariusz Piwczyński
- WIM - dr hab. inż. Adam Lipski, prof. uczelni
- WRiB - prof. dr hab. inż. Anna Piotrowska-Długosz
- WTiICH - dr inż. Justyna Czajka
- WTIiE - dr inż. Zbigniew Lutowski
- WZ - dr inż. Ewa Koreleska
- WSP - mgr Mikołaj Lubczyński
PLAN ZARZĄDZANIA DANYMI (PZD)
1.1. Sposób pozyskiwania i opracowywania nowych danych i/lub ponownego wykorzystania dostępnych danych.
Opis postępowania z każdym rodzajem danych. Jakie dane będą wytwarzane? W jaki sposób? Jeżeli będą wykorzystywane dane z baz komercyjnych, należy zapoznać się z warunkami przetwarzania danych z takich baz, warunkami dalszego udostępniania takich danych. Jeżeli będą wykorzystywane dane z poprzedniego projektu autora, trzeba opisać w jakim zakresie, czy do wszystkich danych autor ma prawa, jeżeli nie czy posiada odpowiednie zgody.
Do rozważenia:
• Jakie dane będą zbierane podczas badań?
• Jak będą gromadzone?
• Czy istnieją już dane, które można ponownie wykorzystać?
• Jakie jest możliwe do przewidzenia inne zastosowanie badawcze dla zgromadzonych danych?
1.2. Pozyskiwane lub opracowywane dane (np. rodzaj, format, ilość)
Wyjaśnienie kwestii technicznych. W jakich formatach będą zapisywane pliki. Format powinien być dostosowany do rodzaju danych. Zasadniczo powinien być wybierany ogólnodostępny format. Ważne jest by do odczytu danych wykorzystywać otwarte oprogramowanie. Warto również zastanowić się, jakie formaty plików funkcjonują w danej dyscyplinie, tak aby użytkownicy po pobraniu zbioru danych nie byli zmuszeni do ich dodatkowej konwersji, która może prowadzić do utraty jakości danych. Należy również dobrze przemyśleć nazewnictwo plików. Podać szacunkową wielkość danych.
Do rozważenia:
• Jakich standardów lub metodologii trzeba użyć, aby wytworzyć dane?
• Czy wybrane formaty i oprogramowania umożliwiają udostępnianie i długotrwałe przechowywanie danych?
• Strukturyzacja oraz nazewnictwo folderów i plików, w których przechowywane będą dane.
2.1. Metadane i dokumenty (np. metodologia lub pozyskiwanie danych oraz sposób porządkowania danych) towarzyszące danym
Metadane to zbiór informacji o danych badawczych, które pozwalają zrozumieć jak powstały dane. Odpowiadają na pytanie: kto, kiedy, w jaki sposób oraz w jakich warunkach wytworzył dane? Do podstawowych metadanych zalicza się następujące informacje: autor, tytuł, data powstania, licencja, dyscyplina naukowa, numer DOI. Prawidłowe metadane umożliwiają scharakteryzowanie danych badawczych w taki sposób, aby potencjalny użytkownik mógł ocenić ich przydatność, możliwość pobrania i ponownego wykorzystania.
Dokumentacja powinna zawierać informacje niezbędne do odczytania i zinterpretowania danych w przyszłości. Opisywać metodologię prowadzonych badań oraz ich kontekst i źródło. Informować o sposobie organizacji danych w trakcie realizacji projektu np. przyjętej konwencji, wersji i strukturze folderów. Zawierać jeżeli to konieczne, dodatkowe pliki potrzebne do skorzystania z danych, wskazywać wykorzystane standardowe słowniki, itd.
Do rozważenia:
• Jakie informacje są niezbędne, aby dane mogły być odczytane i zinterpretowane w przyszłości?
• Jaka dokumentacja i metadane będą opisywać dane?
• W jaki sposób powstanie ta dokumentacja i metadane?
• Które standardy metadanych będą użyte i dlaczego te?
2.2. Stosowane środki kontroli jakości danych
Opis stosowanych w danej dziedzinie procesów, metod dla zapewnienia jakości danych, np. dzienniki laboratoryjne, ustalone schematy działania, powtarzanie procedury w przypadku braku pewności co do uzyskanego pomiaru.
Do rozważenia:
• Jakie procesy będą zastosowane, aby zapewnić odpowiednią jakość danych?
3.1. Przechowywanie i tworzenie kopii zapasowych danych i metadanych podczas badań
Opis sposobu przechowywania danych w całym procesie gromadzenia i ewentualnego ich przetwarzania. W jaki sposób będzie zapewniony bezpieczny dostęp do danych dla wszystkich współpracowników? Jaką procedurę wykonywania kopii będzie stosować się podczas badań?
Do rozważenia:
• Gdzie będą przechowywane dane, jaki ma to wpływ na tworzenie kopii zapasowych, dostęp do danych i ich bezpieczeństwo?
• Czy jest miejsce na przechowywanie danych, czy potrzebne są fundusze na pokrycie kosztów przechowywania danych?
• Kto będzie odpowiedzialny za tworzenie backupów i odzyskiwanie danych?
• Jakie są zagrożenia dla bezpieczeństwa danych i jak nimi zarządzać?
• W jaki sposób będzie zapewniony bezpieczny dostęp do danych dla wszystkich współpracowników?
3.2. Sposób zapewnienia bezpieczeństwa danych oraz ochrony danych wrażliwych podczas badań
Opis metod i procedur dla zapewnienia bezpieczeństwa danych wrażliwych. Na jakim etapie planuje się zastosować metody anonimizacji czy pseudonimizacji? Jeżeli w projekcie nie planuje się wykorzystywania danych wrażliwych, należy w tym punkcie o tym poinformować.
4.1. Sposób zapewnienia zgodności z przepisami dotyczącymi danych osobowych i bezpieczeństwa danych w przypadku przetwarzania danych osobowych
Należy rozważyć wszystkie zagadnienia prawne i etyczne wiążące się z pozyskiwaniem danych w projekcie. Ważne są zwłaszcza ograniczenia udostępniania danych:
• Czy są wymagane zgody na udostępnianie i przechowywanie danych?
• Jak będzie chroniona tożsamość uczestników badań? (np. czy będzie zastosowana anonimizacja?)
• Czy udostępnianie danych zostanie obłożone embargiem lub ograniczone (np. z powodu publikacji lub ubiegania się o patent)?
• Jaka licencja na wykorzystanie danych będzie zastosowana?
4.2. Sposób zarządzania innymi kwestiami prawnymi, np. prawami własności intelektualnej lub własnością
Dane powinny być tak otwarte, jak to możliwe i na tyle zamknięte, na ile to jest konieczne, dlatego zaleca się stosowanie jednej z otwartych licencji Creative Commons (CC0 lub CC-BY).
Należy wskazać właścicieli praw autorskich i praw własności intelektualnej do wszelkich pozyskiwanych i wytwarzanych danych. Trzeba określić czy istnieją jakiekolwiek ograniczenia prawne dotyczące ponownego wykorzystania danych pochodzących od osób trzecich.
5.1. Sposób i termin udostępnienia danych. Ewentualne ograniczenia w udostępnianiu danych lub przyczyny embarga
Kiedy i w jaki sposób będą udostępniane dane z projektu? Czy jeszcze w trakcie trwania projektu czy po zakończeniu badań, należy podać termin lub terminy planowanego udostępnienia? Czy dostęp będzie pełny czy ograniczony? W przypadku przeszkód do pełnego udostępnienia, należy wskazać te ograniczenia. Czy udostępnienie danych nastąpi w otwartym repozytorium danych badawczych?
Należy określić, które dane będą długotrwale przechowywane i chronione.
• Należy wybrać najlepszy sposób przechowywania danych (wybór repozytorium).
• Które dane należy zachować, a które zniszczyć z powodów wynikających z umów i regulacji prawnych?
• Jaki jest plan długoterminowego przechowywania bazy danych?
• Jaki jest koszt przygotowania, przechowywania i udostępniania danych?
• Czy udostępnianie danych zostanie obłożone embargiem lub ograniczone (np. z powodu publikacji lub ubiegania się o patent)?
• Jaka będzie zastosowana licencja na wykorzystywanie danych?
5.2. Sposób wyboru danych przeznaczonych do przechowania oraz miejsce długotrwałego przechowywania danych (np. repozytorium lub archiwum danych)
Nie wszystkie dane muszą zostać udostępnione. Dobierając zbiory danych do archiwizacji warto kierować się takimi czynnikami jak: wymagania agencji finansujących badania naukowe, wartość naukowa danych badawczych, wyjątkowość (czy dane nie duplikują się z innymi istniejącymi już zbiorami danych), możliwość replikacji wyników badań (czy dane zawierają wszystkie parametry umożliwiające powtórzenie eksperymentu), kwestie ekonomiczne (jakie koszty wiążą się z zarządzaniem i przechowywaniem danych i czy są one uzasadnione).
Do rozważenia:
• W jaki sposób będą cytowane dane?
• Z kim będą współdzielone dane i na jakich warunkach?
• Kiedy będzie otwarty dostęp do danych?
• Czy wymagane są jakieś ograniczenia dotyczące udostępniania danych?
• Jakie działania będą podejmowane, aby pokonać lub zminimalizować ograniczenia w dostępie?
• Jak potencjalni użytkownicy dowiedzą się o danych?
• Które dane powinny zostać zachowane i potencjalnie udostępnione?
5.3. Metody lub narzędzia programowe umożliwiające dostęp do danych i korzystanie z danych
W jaki sposób będzie zapewniony dostęp do danych? Czy przewidziane są jakiekolwiek ograniczenia techniczne, np. potrzeba konwersji danych? Jeżeli tak, to czy oprogramowanie do konwersji będzie otwarte czy licencjonowane?
5.4. Sposób zapewniający stosowanie unikalnego i trwałego identyfikatora (np. cyfrowego identyfikatora obiektu (DOI) dla każdego zestawu danych)
Rekomendowane repozytoria otwartych danych badawczych gwarantują przypisanie DOI.
6.1. Osoba (np. funkcja, stanowisko i instytucja) odpowiedzialna za zarządzanie danymi
Osobą odpowiedzialną za zarządzanie danymi jest często kierownik projektu. Można wskazać wyznaczoną jednostkę jako podmiot odpowiedzialny za zarządzanie danymi. W przypadku projektu opartego na współpracy, warto wyjaśnić sposób koordynacji działań w zakresie zarządzania.
Należy przypisać role i obowiązki dla wszystkich działań związanych z zarządzaniem danymi.
Do rozważenia, co jest potrzebne, aby zrealizować plan zarządzania danymi. Kto jest odpowiedzialny za zrealizowanie PZD, oraz za jego sprawdzenie i poprawienie?
• Jak zostaną rozdzielone obowiązki między partnerami w projekcie badawczym?
• Czy wymagana jest dodatkowa wiedza specjalistyczna lub sprzęt?
6.2. Środki (np. finansowe i czasowe) przeznaczone do zarządzania danymi i zapewnienia możliwości odnalezienia, dostępu, interoperacyjności i ponownego wykorzystania danych
Czy do przygotowania danych do przechowywania i archiwizowania niezbędne będą dodatkowe zasoby? Jeżeli tak, jak wysokie będą to koszty i w jaki sposób zostaną oszacowane oraz opłacone? Jeżeli za przestrzeń na serwerach (kopie zapasowe, archiwizacja) trzeba będzie płacić, koszty można ująć w kosztorysie projektu.
Deponowanie danych badawczych:
Dane badawcze będące rezultatem projektów realizowanych w PBS deponowane są w Repozytorium Otwartych Danych RepOD
w kolekcji instytucjonalnej Politechniki
Jak deponować dane:
Deponowanie zbioru danych w Repozytorium Otwartych Danych RepOD
Deponowanie zbioru danych w kolekcji instytucjonalnej
Więcej na temat otwierania danych badawczych:
Otwieranie danych. Podręcznik dobrych praktyk. Ministerstwo Cyfryzacji
Otwieranie danych. Praktyczny poradnik
Wytyczne NCN dla wnioskodawców do uzupełnienia PLANU ZARZĄDZANIA DANYMI w projekcie badawczym.
Selekcja i przygotowanie danych badawczych do udostępnienia.
Prawne aspekty otwierania danych badawczych. Poradnik. Wersja 2.0
Jak korzystać z zasobów w repozytoriach danych
Biblioteka Politechniki Bydgoskiej
Plan Zarządzania Danymi - najczęściej zadawane pytania
Zarządzanie danymi w dyscyplinach naukowych - prezentacje (Otwarta nauka - Szkolenia i Wydarzenia)
Kursy na platformie edukacyjnej Navoica
Pytania, konsultacje - prosimy o kontakt nauka@pbs.edu.pl lub tel. wew. 9275
UWAGA!
Polityka NCN dotycząca Otwartego Dostępu (OA) - złagodzenie zasad!