Dane badawcze

Dane badawcze powstałe w trakcie badań finansowanych ze środków publicznych na mocy przyjęcia przez Parlament Europejski Radę (UE) Dyrektywy w sprawie otwartych danych i ponownego wykorzystywania informacji sektora publicznego (2019/1024) w czerwcu 2019, zostały włączone do danych sektora publicznego, a tym samym podlegają m.in. obowiązkowi otwartego udostępniania. Wiele instytucji finansujących projekty badawcze wymaga przygotowania stosownego planu zarządzania danymi badawczymi. Plan Zarządzania Danymi (PZD) ma za zadanie przedstawić zagadnienia związane z wytworzeniem lub pozyskaniem danych, formaty plików, w których dane zostaną zapisane, omówić przechowywanie danych, sposób dostępu do danych i informacje o ich ponownym wykorzystaniu, przedstawić aspekty prawne i etyczne udostępniania danych, kwestie finansowe, infrastrukturalne i kompetencyjne planowanego przedsięwzięcia naukowego. Narodowe Centrum Nauki jest pierwszą polską instytucją, która PZD wprowadziła do swoich konkursów i uczyniła obowiązkowym elementem wniosku grantowego.

Dla Pracowników naukowych Politechniki Bydgoskiej chcących ubiegać się o środki na projekty badawcze, m.in. z Narodowego Centrum Nauki, przygotowaliśmy pomoc w postaci formatki PZD. Schemat formatki dostępny poniżej. Zamieszczona formatka musi być uzupełniona i dostosowana do indywidualnego projektu. Zespół ds.danych badawczych, powołany przez JM Rektora (Z.189.2020.2021) we współpracy z koordynatorami wydziałowymi ds.danych badawczych, przygotował również formatki dla poszczególnych wydziałów. Formatki dostępne w sieci wewnętrznej PBŚ.

Konsultacje w sprawie sporządzania PZD prowadzi Dział Ewaluacji i Nauki
Kontakt: ren@pbs.edu.pl

Koordynatorzy wydziałowi ds. danych badawczych:

  • WBAiIŚ - mgr inż. Jakub Obszański
  • WHiBZ - dr hab. inż. Dariusz Piwczyński 
  • WIM - dr hab. inż. Adam Lipski, prof. uczelni 
  • WRiB - dr hab. inż. Anna Piotrowska, prof. uczelni 
  • WTiICH - dr inż. Justyna Czajka
  • WTIiE - dr inż. Zbigniew Lutowski 
  • WZ - dr inż. Ewa Koreleska 

PLAN ZARZĄDZANIA DANYMI (PZD)  
FORMATKA DLA PRACOWNIKÓW POLITECHNIKI BYDGOSKIEJ

UWAGA! Formatka PZD musi być dostosowana indywidualnie do projektu. Odpowiedzi na kolejne pytania zależą m.in. od charakteru badań, rodzaju danych, wymogów instytucji finansującej badania, wymogów prawnych. Formularz PZD wypełnia się w języku angielskim.

1.1. Sposób pozyskiwania i opracowywania nowych danych i/lub ponownego wykorzystania dostępnych danych.

Opis postępowania z każdym rodzajem danych. Jakie dane będą wytwarzane? W jaki sposób? Jeżeli będą wykorzystywane dane z baz komercyjnych, należy zapoznać się z warunkami przetwarzania danych z takich baz, warunkami dalszego udostępniania takich danych. Jeżeli będą wykorzystywane dane z poprzedniego projektu autora, trzeba opisać w jakim zakresie, czy do wszystkich danych autor ma prawa, jeżeli nie czy posiada odpowiednie zgody.

Do rozważenia:
•    Jakie dane będą zbierane podczas badań?
•    Jak będą gromadzone?
•    Czy istnieją już dane, które można ponownie wykorzystać?
•    Jakie jest możliwe do przewidzenia inne zastosowanie badawcze dla zgromadzonych danych?

1.2. Pozyskiwane lub opracowywane dane (np. rodzaj, format, ilość)

Wyjaśnienie kwestii technicznych. W jakich formatach będą zapisywane pliki. Format powinien być dostosowany do rodzaju danych. Zasadniczo powinien być wybierany ogólnodostępny format. Ważne jest by do odczytu danych wykorzystywać otwarte oprogramowanie. Warto również zastanowić się, jakie formaty plików funkcjonują w danej dyscyplinie, tak aby użytkownicy po pobraniu zbioru danych nie byli zmuszeni do ich dodatkowej konwersji, która może prowadzić do utraty jakości danych. Należy również dobrze przemyśleć nazewnictwo plików. Podać szacunkową  wielkość danych.

Do rozważenia:
•    Jakich standardów lub metodologii trzeba użyć, aby wytworzyć dane?
•    Czy wybrane formaty i oprogramowania umożliwiają udostępnianie i długotrwałe przechowywanie danych?
•    Strukturyzacja oraz nazewnictwo folderów i plików, w których przechowywane będą dane.

 

2.1. Metadane i dokumenty (np. metodologia lub pozyskiwanie danych oraz sposób porządkowania danych) towarzyszące danym

Metadane to zbiór informacji o danych badawczych, które pozwalają zrozumieć jak powstały dane. Odpowiadają na pytanie: kto, kiedy, w jaki sposób oraz w jakich warunkach wytworzył dane? Do podstawowych metadanych zalicza się następujące informacje: autor, tytuł, data powstania, licencja, dyscyplina naukowa, numer DOI. Prawidłowe metadane umożliwiają scharakteryzowanie danych badawczych w taki sposób, aby potencjalny użytkownik mógł ocenić ich przydatność, możliwość pobrania i ponownego wykorzystania.
Dokumentacja powinna zawierać informacje niezbędne do odczytania i zinterpretowania danych w przyszłości. Opisywać metodologię prowadzonych badań oraz ich kontekst i źródło. Informować o sposobie organizacji danych w trakcie realizacji projektu np. przyjętej konwencji, wersji i strukturze folderów. Zawierać jeżeli to konieczne, dodatkowe pliki potrzebne do skorzystania z danych, wskazywać wykorzystane standardowe słowniki, itd.

Do rozważenia:
•    Jakie informacje są niezbędne, aby dane mogły być odczytane i zinterpretowane w przyszłości?
•    Jaka dokumentacja i metadane będą opisywać dane?
•    W jaki sposób powstanie ta dokumentacja i metadane?
•    Które standardy metadanych będą użyte i dlaczego te?

2.2. Stosowane środki kontroli jakości danych

Opis stosowanych w danej dziedzinie procesów, metod dla zapewnienia jakości danych, np. dzienniki laboratoryjne, ustalone schematy działania, powtarzanie procedury w przypadku braku pewności co do uzyskanego pomiaru.

Do rozważenia:
•    Jakie procesy będą zastosowane, aby zapewnić odpowiednią jakość danych?

 

3.1. Przechowywanie i tworzenie kopii zapasowych danych i metadanych podczas badań
Opis sposobu przechowywania danych w całym procesie gromadzenia i ewentualnego ich przetwarzania. W jaki sposób będzie zapewniony bezpieczny dostęp do danych dla wszystkich współpracowników? Jaką procedurę wykonywania kopii będzie stosować się podczas badań?
Do rozważenia:
•    Gdzie będą przechowywane dane, jaki ma to wpływ na tworzenie kopii zapasowych, dostęp do danych i ich bezpieczeństwo?
•    Czy jest miejsce na przechowywanie danych, czy potrzebne są fundusze na pokrycie kosztów przechowywania danych?
•    Kto będzie odpowiedzialny za tworzenie backupów i odzyskiwanie danych?
•    Jakie są zagrożenia dla bezpieczeństwa danych i jak nimi zarządzać?
•    W jaki sposób będzie zapewniony bezpieczny dostęp do danych dla wszystkich współpracowników?

3.2. Sposób zapewnienia bezpieczeństwa danych oraz ochrony danych wrażliwych podczas badań
Opis metod i procedur dla zapewnienia bezpieczeństwa danych wrażliwych. Na jakim etapie planuje się zastosować metody anonimizacji czy pseudonimizacji? Jeżeli w projekcie nie planuje się wykorzystywania danych wrażliwych, należy w tym punkcie o tym poinformować.

 

4.1. Sposób zapewnienia zgodności z przepisami dotyczącymi danych osobowych i bezpieczeństwa danych w przypadku przetwarzania danych osobowych

Należy rozważyć wszystkie zagadnienia prawne i etyczne wiążące się z pozyskiwaniem danych w projekcie. Ważne są zwłaszcza ograniczenia udostępniania danych:
•    Czy są wymagane zgody na udostępnianie i przechowywanie danych?
•    Jak będzie chroniona tożsamość uczestników badań? (np. czy będzie zastosowana anonimizacja?)
•    Czy udostępnianie danych zostanie obłożone embargiem lub ograniczone (np. z powodu publikacji lub ubiegania się o patent)?
•    Jaka będzie zastosowana licencja na wykorzystywanie danych?

4.2. Sposób zarządzania innymi kwestiami prawnymi, np. prawami własności intelektualnej lub własnością

Dane powinny być tak otwarte, jak to możliwe i na tyle zamknięte, na ile to jest konieczne, dlatego zaleca się stosowanie  jednej z otwartych licencji Creative Commons (CC-BY lub CC-BY-NC).
Należy wskazać właścicieli praw autorskich i praw własności intelektualnej do wszelkich pozyskiwanych i wytwarzanych danych. Trzeba określić czy istnieją jakiekolwiek ograniczenia prawne dotyczące ponownego wykorzystania danych pochodzących od osób trzecich.

 

5.1. Sposób i termin udostępnienia danych. Ewentualne ograniczenia w udostępnianiu danych lub przyczyny embarga

Kiedy i w jaki sposób będą udostępniane dane z projektu? Czy jeszcze w trakcie trwania projektu czy po zakończeniu badań, należy podać termin lub terminy planowanego udostępnienia? Czy dostęp będzie pełny czy ograniczony? W przypadku przeszkód do pełnego udostępnienia, należy wskazać te ograniczenia. Czy udostępnienie danych nastąpi w otwartym repozytorium danych badawczych?

Należy określić, które dane będą długotrwale przechowywane i chronione.
•    Należy wybrać najlepszy sposób przechowywania danych (wybór repozytorium).
•    Które dane należy zachować, a które zniszczyć z powodów wynikających z umów i regulacji prawnych?
•    Jaki jest plan długoterminowego przechowywania bazy danych?
•    Jaki jest koszt przygotowania, przechowywania i udostępniania danych?
•    Czy udostępnianie danych zostanie obłożone embargiem lub ograniczone (np. z powodu publikacji lub ubiegania się o patent)?
•    Jaka będzie zastosowana licencja na wykorzystywanie danych?


5.2. Sposób wyboru danych przeznaczonych do przechowania oraz miejsce długotrwałego przechowywania danych (np. repozytorium lub archiwum danych)

Nie wszystkie dane muszą zostać udostępnione. Dobierając zbiory danych do archiwizacji warto kierować się takimi czynnikami jak: wymagania agencji finansujących badania naukowe, wartość naukowa danych badawczych, wyjątkowość (czy dane nie duplikują się z innymi istniejącymi już zbiorami danych), możliwość replikacji wyników badań (czy dane zawierają wszystkie parametry umożliwiające powtórzenie eksperymentu), kwestie ekonomiczne (jakie koszty wiążą się z zarządzaniem i przechowywaniem danych i czy są one uzasadnione).

Do rozważenia:
•    W jaki sposób będą cytowane dane?
•    Z kim będą współdzielone dane i na jakich warunkach?
•    Kiedy będzie otwarty dostęp do danych?
•    Czy wymagane są jakieś ograniczenia dotyczące udostępniania danych?
•    Jakie działania będą podejmowane, aby pokonać lub zminimalizować ograniczenia w dostępie?
•    Jak potencjalni użytkownicy dowiedzą się o danych?
•    Które dane powinny zostać zachowane i potencjalnie udostępnione?

5.3. Metody lub narzędzia programowe umożliwiające dostęp do danych i korzystanie z danych

W jaki sposób będzie zapewniony dostęp do danych? Czy przewidziane są jakiekolwiek ograniczenia techniczne, np. potrzeba konwersji danych? Jeżeli tak, to czy oprogramowanie do konwersji będzie otwarte czy licencjonowane?

5.4. Sposób zapewniający stosowanie unikalnego i trwałego identyfikatora (np. cyfrowego identyfikatora obiektu (DOI) dla każdego zestawu danych)

Rekomendowane repozytoria otwartych danych badawczych gwarantują przypisanie DOI.

 

6.1. Osoba (np. funkcja, stanowisko i instytucja) odpowiedzialna za zarządzanie danymi  
Osobą odpowiedzialną za zarządzanie danymi jest często kierownik projektu. Można wskazać wyznaczoną jednostkę jako podmiot odpowiedzialny za zarządzanie danymi. W  przypadku  projektu  opartego  na współpracy,  warto   wyjaśnić  sposób koordynacji  działań  w zakresie  zarządzania.
Należy przypisać role i obowiązki dla wszystkich działań związanych z zarządzaniem danymi.
Do rozważenia, co jest potrzebne, aby zrealizować plan zarządzania danymi. Kto jest odpowiedzialny za zrealizowanie PZD, oraz za jego sprawdzenie i poprawienie?
•    Jak zostaną rozdzielone obowiązki między partnerami w projekcie badawczym?
•    Czy wymagana jest dodatkowa wiedza specjalistyczna lub sprzęt?

6.2. Środki (np. finansowe i czasowe) przeznaczone do zarządzania danymi i zapewnienia możliwości odnalezienia, dostępu, interoperacyjności i ponownego wykorzystania danych
Czy  do  przygotowania  danych do  przechowywania  i  archiwizowania niezbędne  będą  dodatkowe zasoby? Jeżeli tak, jak wysokie będą to koszty i w jaki sposób zostaną oszacowane oraz opłacone? Jeżeli za przestrzeń na serwerach (kopie zapasowe, archiwizacja) trzeba będzie płacić, koszty można ująć w kosztorysie projektu.

 

Więcej na temat otwierania danych badawczych:

Otwieranie danych. Podręcznik dobrych praktyk. Ministerstwo Cyfryzacji.

Portal z danymi publicznymi.

Dane badawcze (2020), oprac. Anna Książczak-Gronowska, Maja Bogajczyk. Biblioteka Uniwersytecka w Warszawie.

Wytyczne dla wnioskodawców do uzupełnienia PLANU ZARZĄDZANIA DANYMI w projekcie badawczym.

Selekcja i przygotowanie danych badawczych do udostępnienia.

Prawne aspekty otwierania danych badawczych. Poradnik.

Biblioteka Politechniki Bydgoskiej