Uwagi Fundacji ePaństwo do Programu Otwierania Danych Publicznych

Jan Żankowski

Jan Żankowski

16 czerwca 2016

Przeczytasz w 18 minut

Fundacja ePaństwo działa na rzecz rozwoju demokracji, otwartej i przejrzystej władzy oraz zaangażowania obywatelskiego. Wykorzystując moc Internetu i nowe technologie otwieramy różne zasoby danych publicznych i bezpłatnie udostępniamy je obywatelom. Dajemy im wiedzę i narzędzia do ulepszania swojego państwa.   Fundacja wspiera również wszystkie inicjatywy, które służą otwieraniu danych publicznych, tak w ramach projektu Otwarte miasta, w którym władze wiodących polskich miast realizują systemową politykę udostępniania informacji, jak i w ramach współpracy z Ministerstwem Cyfryzacji w tworzeniu pierwszego polskiego oficjalnego portalu danych publicznych w postaci Centralnego Rejestru Informacji Publicznej.   W związku z powyższym, wyrażamy uznanie dla sformułowanej przez resort cyfryzacji systemowej strategii uwalniania informacji o stanie państwa i jego instytucji. Wierzymy, że takie programy wprowadzą rzeczywistą zmianę w relacjach władza – obywatel i spowodują wzrost przejrzystości, a co za tym idzie, również wzrost zaufania do administracji publicznej. Nie bez znaczenia, dzięki polityce otwartości, pozostaje również wzmocnienie sektora usług oraz wygody obywateli.   Program zaproponowany przez Ministerstwo wpisuje się również w międzynarodowe inicjatywy takie jak Open Government Partnership czy International Open Data Charter. Pozostaje niedosyt, że mimo zabiegów licznych środowisk, w tym Koalicji na Rzecz Otwartego Rządu, Polska nie zdecydowała się oficjalnie włączyć w ich prace. Konsekwentnie zachęcamy, aby rząd stał się oficjalnie częścią światowego ruchu otwartych państw. Proponowany Program byłby dobrym początkiem włączenia się w międzynarodowy nurt przejrzystości władz publicznych.  
  • Uwagi ogólne
  Program należy ocenić jako dobry, ale warto uzupełnić go o pewne składniki, które sprawią, że Polska stanie się krajem pozostającym w awangardzie otwartości danych publicznych. Już teraz niektóre z polskich miast jako swoje priorytety uznały realizowanie polityki otwartości, co zostało zauważone i docenione na świecie. Gdańsk, jako jedyne w Europie miasto zostało wyróżnione przez Bloomberg Philatrophies uzyskując wsparcie dla dalszego rozwoju polityki otwierania danych. Jako inicjatorzy wprowadzenia tej polityki w Gdańsku zachęcamy autorów Programu do szczegółowego zapoznania się ze sposobem prowadzenia działań w stolicy Pomorza (dostępne na stronie http://epf.org.pl/pl/projekty/otwarte-miasta/), a w celu uzyskania szczegółowych informacji pozostajemy do dyspozycji Ministerstwa.   Celem Programu jest poprawa jakości i zwiększenie liczby danych dostępnych w CRIP. Chociaż nie sposób nie zgodzić się z tak sformułowanym celem, to pozostaje on, w naszym odczuciu, zbyt ograniczony. Zgadzamy się, że Centralne Repozytorium Informacji Publicznej powinno stać się głównym portalem udostępniania danych, ale praktyka, z którą się spotykamy wskazuje, że dostęp do informacji może i powinien odbywać się również za pośrednictwem innych punktów dostępu. CRIP jest co do zasady portalem zbierającym dane z różnych instytucji i będzie z reguły zawierał te dane, które zostały określone jako obowiązkowe do przekazania, bądź, które instytucja zamierza przekazać. Duża część bieżąco aktualizowanych danych pozostanie jednak na stronach określonych podmiotów, przede wszystkim na prowadzonych przez nie Biuletynach Informacji Publicznej. Jednocześnie, jak wskazują liczne badania1, strony Biuletynów Informacji Publicznej są prowadzone w sposób nie gwarantujący dostępu do aktualnych danych publicznych. Program powinien zatem uwzględniać nie tylko dane przekazywane do CRIP, ale również odnosić się do całościowej polityki obejmującej otwieranie instytucji publicznych. Co prawda, wyznaczone w pkt 8 Programu zadania strategiczne na lata 2016 – 2020 przewidują poprawę jakości zbieranych i udostępnianych danych publicznych niezależnie od miejsca przechowywania i udostępniania zgodnie z filarami otwartości oraz standardem udostępniania danych, ale proponowane w załączniku nr 1do Programu zmiany przewidują wyłącznie publikację w CRIP.   Niewykorzystanym instrumentem wspierającym realizację celu Programu pozostaje Scentralizowany System Dostępu do Informacji Publicznej. Pamiętać należy, że według różnych szacunków kilkadziesiąt podmiotów zobowiązanych do prowadzenia Biuletynów Informacji Publicznej nie posiada lub nie aktualizuje stron tych publikatorów. Rolą Ministerstwa Cyfryzacji powinno być wspieranie i rozwój systemu dostępu do informacji również za pośrednictwem stron BIP, gdyż nie istnieją żadne inne, formalne metody egzekwowania prowadzenia stron BIP i publikowania w nich aktualnych informacji. Warto również zauważyć, że budżet państwa poniósł koszty związane tak z prowadzeniem strony głównej BIP, jak i z udostępnieniem usługi SSDIP. Im więcej podmiotów będzie prowadziło strony BIP zgodnie z warunkami określonymi w ustawie o dostępie do informacji publicznej oraz aktami wykonawczymi do niej, tym łatwiej będzie realizować politykę otwierania danych za pośrednictwem Centralnego Repozytorium. Szczególnie istotne będzie to w przypadku jednostek samorządu terytorialnego, które z jednej strony potrafią stanowić przykład daleko wybiegających w przyszłość wizji otwierania danych, a z drugiej brak im dostępu do dobrych przykładów i możliwości wsparcia przez administrację centralną, która w związku z zasadą subsydiarności widząc, że wiele instytucji samorządowych nie radzi sobie z otwieraniem zasobów powinna im w tym z pełnym zaangażowaniem pomagać.Pomoże zrealizować to założenie Programu polegające na zapewnieniu “stałego dostępu do danych publicznych, które chociaż raz zostały udostępnione bez opłat na wniosek o dostęp do informacji publicznej lub na wniosek o ponowne wykorzystywanie, lub w sieci Internet;”   Jednocześnie zgadzamy się z podejściem zaprezentowanym w programie, że dostęp do informacji w BIP-ach i CRIP powinien ulec harmonizacji. Przestrzegamy jednak przed łączeniem obydwu systemów, tak aby pozostawić ambitnym podmiotom publicznym możliwość rozwijania swoich stron Biuletynu. Większy nacisk powinien zostać również położony na wsparcie jednostek samorządu terytorialnego szczególnie gmin wiejskich i wiejsko-miejskich, które są gotowe na użycie darmowych i prostych narzędzi udostępniania danych.   Doceniamy, że przedstawione w Programie cele szczegółowe uwzględniają wiele środowisk i podejść do zakresu otwieranych danych. Warto jednak zwrócić uwagę, że idea otwartego rządu nie polega głównie na kierunkowym wspieraniu przedsiębiorców, a na wskazanym w punkcie 3 celów szczegółowych zwiększeniu „przejrzystości i skuteczności działań organów administracji, usprawnieniu działań urzędów oraz możliwości partycypacji obywateli w sprawowaniu władzy, analizie czy wykorzystywaniu ponownym danych publicznych”. Skupienie się, w pierwszym rzędzie na tym celu pozwoli na realizację kolejnych. W kraju, którego instytucje nie działają przejrzyście, a więc nie udostępniają danych zawierających informacje o działaniu władz i osób pełniących funkcje publiczne, żadne innowacje się nie udadzą, a wzrost gospodarczy – czego dowodem jest reakcja rynków na bezprawne działania rządu związane z brakiem realizacji wyroków Trybunału Konstytucyjnego – będzie zagrożony. Rząd powinien się zatem skupić w pierwszym rzędzie na realizacji celu wskazanego w punkcie 3 celów szczegółowych Programu, co zresztą potwierdzają wyniki ankiety zrealizowanej na potrzeby Programu. Brakuje również uwzględnienia w Programie celu zmierzającego do ograniczenia sfery ubóstwa w Polsce. Siłą otwartych danych nie jest jedynie tworzenie miejsc pracy w innowacyjnych gałęziach gospodarki ale również możliwa dzięki nim analiza problemów społecznych i reakcja na nie. Program musi uwzględniać i ten obszar, gdyż bez niego, w dziedzinie gospodarki ograniczy się jedynie do wspierania rynku pracy obejmującego wąską grupę osób, natomiast całe obszary problemów społecznych pozostaną nie załatwione.   Jesteśmy zwolennikami tzw. taniego państwa, nie przeznaczającego nadmiernych środków na aparat biurokratyczny. Nie uważamy jednak, że zasada taniego państwa jest istotniejsza niż zasada państwa działającego w sposób efektywny. Często – i tak jest również w tym wypadku – są to wartości nie do pogodzenia, przynajmniej na początkowym etapie realizacji Programu. Z tego względu, uważamy, że uznanie przez Ministerstwo, że realizacja Programu nie będzie niosła za sobą dodatkowych kosztów może zagrozić jego wdrażaniu. Wprowadzenie polityki otwartych danych w poszczególnych instytucjach będzie wymagało oprócz, wskazanych w Programie kosztów szkoleń, poniesienia kosztów zatrudnienia dodatkowego personelu, zakupu sprzętu lub oprogramowania. Jeśli Ministerstwo poważnie myśli o realizacji celu Programu, powinno przeznaczyć na to odpowiednie środki. Wiemy z doświadczenia w miastach, w których realizujemy projekt Otwarte Miasta, że sama dobra wola (a nie zawsze przecież i ona występuje) to za mało, by w pełni realizować zadania w tym obszarze. W związku z tym, sugerujemy, aby Ministerstwo uwzględniło środki na realizację Programu i wystąpiło o nie do ministra finansów w ramach rezerwy budżetowej lub skierowało wniosek o zabezpieczenie tych środków w ustawie budżetowej na rok przyszły. Wydaje się, że sama praca zespołu zadaniowego skupionego na realizacji Programu może objąć co najmniej kilka etatów.  Zwracamy uwagę, że nie wskazano w harmonogramie, kiedy Zespół ma rozpocząć swoje prace. Wskazane jest zabezpieczenie środków na dodatkowe etaty w kluczowych instytucjach opracowujących i udostępniających dane na potrzeby Programu. Program mógłby również zawierać zalecenie stworzenia w każdej z jednostek nim objętym, etatu osoby odpowiedzialnej za przygotowywanie i udostępnianie danych. .Najbardziej kluczowy etap realizacji Programu będzie miał bowiem miejsce na początku jego realizacji. Samo przygotowanie danych zgodnie ze wskazanymi wytycznymi będzie generowało koszty częstokroć większe niż samo ich udostępnienie.   W związku z tym, że większość respondentów ankiety będącej jedną z podstaw stworzenia Programu wskazało, że celem pozyskiwania przez nich danych jest użycie ich do działalności naukowej i edukacyjnej warto rozważyć realizację ściślejszej współpracy z resortami szkolnictwa wyższego oraz edukacji narodowej. Każdy z resortów powinien wdrożyć osobną politykę udostępniania danych dotyczących badań i analiz prowadzonych przez podległe lub nadzorowane jednostki. Otwieranie zasobów edukacyjnych, w tym dostępu do badań naukowych jest przedmiotem ożywionej dyskusji w środowisku naukowym na świecie i coraz częściej możemy obserwować przykłady udostępniania takich danych. Zalążki takich inicjatyw możemy obserwować już w Polsce. Za przykład może służyć prowadzony przez Akademię Górniczo-Hutniczą portal Open AGH (http://open.agh.edu.pl/index.php?id=1&theme=1280). Program powinien zostać zatem uzupełniony o zalecenie opracowania przez poszczególne resorty polityk otwartości kierowanych do podległych lub nadzorowanych przez nie podmiotów. Istotnym elementem, który również doczekał się realizacji na świecie i w wybranych przypadkach również w Polsce, jest także polityka otwartości zasobów kultury. To ostatnie ma o tyle duże znaczenie, że w związku z przyjęciem ustawy o ponownym wykorzystywaniu informacji sektora publicznego, instytucje kultury będą zmuszone, wdrażając jej przepisy opracowywać swoje polityki otwartości. Należy wykorzystać tę szansę na stworzenie komplementarnej polityki otwierania zasobów kultury. Niezależnie od wzmocnienia komponentu edukacyjnego, naukowego i kulturalnego procesu otwierania danych publicznych, dedykowana polityka otwartych danych w tym obszarze wpłynie z pewnością na rozwój innowacyjności gospodarki i polityki socjalnej.  
  • Uwagi szczegółowe.
  Definicja ponownego wykorzystywania informacji sektora publicznego. Zawarta w pkt 2 Programu definicja ponownego wykorzystywania stanowi powtórzenie definicji legalnej znajdującej się w ustawie o ponownym wykorzystywaniu informacji sekora publicznego. Jest to niestety definicja niezrozumiała i stanowi podstawę wielu problemów z uzyskaniem informacji publicznej w celu jej rozpowszechniania. Grupa organizacji pozarządowych skupiona w Koalicji na Rzecz Otwartego Rządu zwracała na to wielokrotnie uwagę m.in. w opiniach przekazanych w toku prac nad ustawą. Niestety, sposób implementacji dyrektywy przez Polskę skomplikował w tym aspekcie możliwość wykorzystywania danych, odróżniając niepotrzebnie istniejące prawo do pozyskiwania i rozpowszechniania informacji od pojęcia jej ponownego wykorzystywania.W związku z brakiem uwzględnienia uwag opartych przede wszystkim na analizie praktyki funkcjonowania przepisów rozdziału 2a ustawy z dnia 6 września o dostępie do informacji publicznej, odróżnienie obu trybów wymaga zatem dokonania interpretacji istniejących przepisów, tak aby użytkownicy mieli pewność co do poprawności korzystania z określonych uprawnień, podmioty zobowiązane nie ograniczały, jak do tej pory, dostępu do informacji przez dziennikarzy i organizacje pozarządowe. Istotnym elementem wyróżniającym ponowne wykorzystywanie od rozpowszechniania jest osadzenie korzystania z danych na stworzeniu przez ich użytkownika wartości dodanej, a więc możliwości uzupełniania i łączenia uzyskanych informacji. Istotną cechą jest również cykliczność udostępniania i wykorzystywania danych poprzez zapewnienie stałego dostępu do nich.  Taka interpretacja znajduje również swoje uzasadnienie w wykładni słowa wykorzystywanie, które w przeciwieństwie do wyrazu wykorzystanie oznaczać będzie stałą interakcję użytkownika z danymi. Sugerujemy zatem, aby przynajmniej na potrzeby Programu definicja ponownego wykorzystywania została określona w sposób uwzględniający rzeczywistą praktykę, a nie błędną i szkodliwą dla wolności pozyskiwania i rozpowszechniania informacji definicję ustawową. Sugerujemy również aby unikać stosowania synonimów w postaci wyrazu “powtórne” gdyż wyraz ten jeszcze gorzej oddaje ideę re-use.   Otwieranie zasobów to gotowość administracji do poddania się publicznej ocenie. Z uznaniem odnosimy się do ambitnego zakresu i harmonogramu udostępnianych danych, o których mowa w załączniku nr 2 do Programu. Wskazujemy jednak, że, o ile są to dane interesujące do wykorzystywania dla niektórych segmentów gospodarki i mogą stanowić podstawę stworzenia efektywnych usług dla obywateli, to pod względem wpływu na przejrzystość funkcjonowania państwa nie mają większego znaczenia. Otwarte dane muszą bowiem w pierwszym rzędzie służyć zwiększeniu jawności działania instytucji publicznych, co w konsekwencji sprzyja wzrostowi poziomu partycypacji społecznej oraz przeciwdziała korupcji. Z badań przeprowadzonych w ramach projektu TACOD, wynika, że aż 7% przypadków korupcji w Zjednoczonym Królestwie zostało odkrytych dzięki rzetelnemu wdrażaniu otwatych danych. Polska powinna, wraz ze zgłoszeniem akcesu do Patnerstwa na rzecz otwartego rządu (OGP), zaangażować się również w inicjatywę realizowaną m.in. przez Bank Światowy pod nazwą International Open Data Charter. Zgodnie z opracowanym przez tę ostatnią inicjatywę, pakietem antykorupcyjnym (Anticorruption Charter. Putting the Open Data Charter into practice) udostępnieniu w formule otwartych danych powinny podlegać dane dotyczące m.in. deklaracji majątkowych, które w Polsce - na co, niestety mimo wielu uwag, pozwalają przepisy prawa -wypełniane są ręcznie i prezentowane na stronach poszczególnych instytucji z dużym opóźnieniem i formie uniemożliwiającej maszynowe odczytanie. Zresztą, z uwagi na charakter pisma niektórych funkcjonariuszy publicznych, uniemożliwiące odczytanie w ogóle   Wśród udostępnionych danych powinny się znaleźć również budżety poszczególnych jednostek - tak planowany jak i uwzględniający bieżące zmiany i stan realizacji (zob. Fiscal Data Package specification). Obowiązkowo powinny być również udostępniane rejestry wydatków ponoszonych przez instytucje w takiej formie w jakiej robi to np. miasto Gdańsk, a więc zapewniającej bieżącą aktualizację i możliwość dowolnego przetwarzania danych. Dużym problemem pozostaje rozdzielenie bazy KRS i CEiDG, co uniemożliwia sprawne identyfikowanie beneficjentów pieniędzy publicznych. Niezależnie od powyższego ograniczenie dostępu do obydwu prowadzonych rejestrów poprzez zastosowanie zabezpieczeń sprawia, że są one w zasadzie bezużyteczne z punktu widzenia zasad otwartych danych. Poprawa udostępnienia wyłącznie danych statystycznych ewidencji i działalności gospodarczej jest zatem w dalekiej mierze niewystarczająca. Dlatego postulujemy otwarcie obu wspomnianych rejestrów, rozważając ich publikację w postaci zgodnej z inicjatywą Open Corporates.   Księgi wieczyste są kolejnym ze zbiorów rekomendowanych do otwarcia przez partnerstwo IODC. Należy podkreślić, że obecnie księgi wieczyste są łatwo dostępne do przeglądania po numerze działki, co nie jest dostępne w oficjalnym serwisie, a za pomocą odpłatnych serwisów prowadzonych za granicami Polski, a to mocno ingeruje w prywatność obywateli. Postulujemy przeprowadzenie rzeczowej debaty oraz otwarcie ksiąg wieczystych w sposób, który wyważy możliwość społecznej kontroli własności gruntów oraz prawo do prywatności.   Problemem pozostaje również ograniczony dostęp do informacji zawartych w Biuletynie Zamówień Publicznych. Warto skoncentrować się na poprawie tego systemu, aby zwiększyć przejrzystość zawartych w nim danych publikując je w popularnym Open Contracting Standard.   Widzimy także wartość w sporządzeniu kompletnego i referencyjnego rejestru danych adresowych, w tym potencjalnie możliwość lepszego umocowania prawnego rejestrów EMUiA lub TERYT-ADR.   Warto zauważyć w powyższym kontekście, że doprecyzowania wymaga zawarty w Programie postulat ‘udostępniania przynajmniej trzech nowych zestawów danych o  wysokiej wartości (high-value data sets) w ciągu 60 dni od momentu wejścia w życie Programu oraz nowych danych na koniec każdego kwartału”. Autorzy programu nie wyjaśniają, jakie zestawy danych są danymi o wysokiej wartości. Załącznik nr 1 posługuje się pojęciem “priorytetowych obszarów otwierania danych” co nie wydaje się tożsamym pojęciem. Zgodnie z propozycją zawartą w opracowanym przez Komisję Europejską raporcie (Report on high-value datasets from EU institutions) są to w pierwszym rzędzie dane, które dotyczą przejrzystości i otwartości instytucji publicznych. Tym bardziej to dane z tej grupy powinny stać się priorytetowymi obszarami otwierania danych. Z pewnością, Program powinien być w tym kontekście precyzyjny i wyraźnie wskazywać sposób oceny czy konkrentne zestawy danych spełniają kryteria high-value data sets. Bez tego niemożliwe będzie wskazanie czy doszło do implementacji programu w tym obszarze w założonym terminie.   Finalnie, aby przeprowadzić skuteczną priorytetyzację zbiorów danych uważamy, że Program powinien postulować utworzenie publicznie prowadzonych katalogów zbiorów danych prowadzonych przez instytucje publiczne w jakiejkolwiek postaci. Takie katalogi stanowiłyby podstawę do rzeczowej dyskusji pozwalającej wyłonić zbiory danych interesujące dla różnych grup odbiorców.   Otwarte dane powinny być otwarte. Mamy również szereg uwag dotyczących aspektów technologicznych Programu. Program wymienia rozszerzenia plików, które nie zawsze pokrywają się jeden do jeden z formatami, które przechowują. Stosowanie takich skrótów myślowych, choć użyteczne na co dzień, powinno zostać uzupełnione o nazwy formatów danych. W szczególności sugerujemy usunięcie rozszerzenia xls, a więc formatów MS-XLS oraz XML Spreadsheet, jako polecanych do danych ustrukturyzowanych, ze względu na to, że nie są to formaty otwarte. Format CSV posiada swoją specyfikację w postaci dokumentu RFC 4180 i sugerujemy jego wykorzystanie zgodne z tą specyfikacją, a więc stosowanie przecinka jako rozdzielnika pól, kropki jako symbola dziesiętnego, a podwójnych cudzysłów do oznaczania tekstu. Do formatów polecanych do używania jako tych o najwyższym stopniu otwartości, oprócz Office Open XML (rozszerzenie xlsx) i CSV (RFC 4180), sugerujemy dodanie popularnego JavaScript Object Notation (rozszerzenie json, specyfikacja RFC 4627), choć należy pamiętać, że nigdy nie będzie to katalog zamknięty.   Choć otwarte formaty danych ułatwiają ich przetwarzanie to wysoką interoperacyjność zapewniają dopiero standardy danych przyjęte lub wdrażane przez wiele niezależnych podmiotów. Sugerujemy, aby to standardy danych były postulowane jako najwyższy stopień otwartości danych. Ich katalog powinien być otwarty, a sugestie powinny być dodawane biorąc pod uwagę aktualne trendy sugerowane przez ISO, OGP oraz IODC.   Uwagi korekcyjne
  • Punkt 3.7 w dokumencie “Standardy otwartości danych” jest niezrozumiały dla nas (“dopuszcza się plik w formacie XLS wyłącznie jako ustrukturyzowany zasób informacji publicznej (nie jako plik danych)”)
  • Punkt 3.8 powtarza punkt 1
  • w przykładach pliki CSV mają niezgodną postać z wytycznymi w dokumencie, ale zgodną z tym, co sugerujemy
  • Na stronie 19: brakuje "jednak" przed "wymaga dalszych prac"
  • Na stronie 20: "Rumunia" zamiast "Riminia"
  • Na stronie 12: Odnośnik do inicjatywy IODC powinien wskazywać na url opendatacharter.net
  • Na stronie 19: Do lokalnych portali otwarto danowych warto byłoby dodać portal Poznania dostępny pod adresem http://egov.psnc.pl/node/29
  • Na stronie 19: Wspominając europejski portal danych, warto wspomnieć że dane z CRIP są tam już automatycznie importowane
  Fundacja ePaństwo doceniając zaangażowanie Ministerstwa w proces otwierania danych publicznych, wyraża nadzieję, że przedstawione uwagi zostaną uwzględnione. Jeżeli nie na tym etapie, to przynajmniej w długofalowej strategii regulującej ten obszar. Tak jak do tej pory, wyrażamy gotowość do współpracy i dalszego przekazywania naszych sugestii i rekomendacji   Opracowali: Krzysztof Izdebski, Krzysztof Madejski   Program Otwierania Danych Publicznych Uwagi Fundacji ePaństwo do Programu Otwierania Danych Publicznych