W przeprowadzonym przez nas ostatnio badaniu otwartości danych w Polsce dane jakości powietrza wypadły jako najbardziej otwarte. Doświadczenie ich praktycznego wykorzystania nadal jednak odbiega od ideału.

W grudniu wzięliśmy udział w globalnym badaniu otwartości danych Global Open Data Index badając sytuację w Polsce. Dane o jakości powietrza udostępniane przez Główny Inspektorat Ochrony Środowiska wypadły w naszej ocenie najlepiej:

Jednocześnie przy praktycznym wykorzystaniu danych napotyka się na barierę związaną z tym, że bieżące pomiary nie są udostępniane w formacie maszynowo przetwarzalnym (json, csv, xml). Obecna forma publikacji „w postaci tekstowej” (prosty ustrukturyzowany HTML) wymusza przeprowadzenie przetwarzania danych (tzw. parsowania), które pozwoli łatwo je wykorzystywać w programach komputerowych.

Na tę barierę oprócz nas natrafili także twórcy popularnych aplikacji mobilnych, a także akademicy pracujący na danych.

Chcąc poprawić tę sytuację skontaktowaliśmy się w grudniu 2016 z GIOŚ, do dziś dnia nie dostaliśmy jednak odpowiedzi. Dlatego we wtorek 7 lutego spróbowaliśmy innej ścieżki – wystąpiliśmy z wnioskiem o udostępnienie bieżących danych pomiarów „w sposób stały i bezpośredni w czasie rzeczywistym”, w postaci maszynowo przetwarzalnej,  na podstawie ustawy o ponownym wykorzystywaniu informacji sektora publicznego.

Jak powinno wyglądać udostępnianie takich informacji?

Obecne problemy związane z częstym brakiem odpowiedzi serwerów GIOŚ zdają się wskazywać na to, że niezależne serwisy lub aplikacje mobilne podłączają się bezpośrednio do serwisu GIOŚ (np. poprzez zapytania obsługujące mapę) bez odpowiedniego cache’owania danych. Rozwiązaniem, które zapewniałoby wysoką wydajność, a także wymuszałoby dobre praktyki cache’owania danych byłoby wprowadzenie otwartej rejestracji serwisów korzystających z danych. Rejestracja taka wymagałaby jedynie podania adresu(ów) IP serwerów, które dane by pobierały.

GIOŚ po otwarciu danych powinien także porządnie udokumentować interfejs dostępu do danych – API.  API to mogłoby być tak proste jak folder z plikami pomiarów w otwartych ustrukturyzowanych formatach dla każdej godziny z ostatnich x dni. W zupełności wystarczyłoby to twórcom aplikacji.