Jakie książki polityczne wypożyczyliśmy z biblioteki, czy jechaliśmy ostatnio autostradą A4 i w jakim kierunku, czy uczestniczyliśmy w warsztatach dla osób dotkniętych przemocą domową lub uzależnionych, ile wody zużywamy w dzień, a ile w nocy? To tylko kilka przykładów danych, jakie gromadzą na nasz temat podmioty realizujące zadania publiczne. Dane te są rozproszone w setkach tysięcy, jeśli nie milionach różnych zbiorów. Teraz wszystkie one mają być agregowane i udostępniane na żądanie rządu. Gdyby były skutecznie zanonimizowane, to nie stanowiłoby to większego zagrożenia. Problem w tym, że przepisy nie określają standardów tej anoninimizacji, a na dodatek dopuszczają też pseudoanonimizację, a więc proces z założenia odwracalny i pozwalający ustalić osobę, na której temat zgromadzono informacje.

Za i przeciw

Regulacje pozwalające premierowi, jego pełnomocnikowi oraz szefowi KPRM żądać dostępu do wszystkich danych gromadzonych przez podmioty realizujące zadania publiczne dołączono do projektu tarczy antykryzysowej 2.0. Chodzi o dodanie art. 10a do ustawy o Radzie Ministrów (t.j. Dz.U. z 2019 r. poz. 1171 ze zm.; patrz: ramka).

Cel? Jak najbardziej szczytny.

„We współczesnym życiu publicznym coraz większe znaczenie mają gromadzone informacje. (...) Informacje te są zgromadzone w zbiorach danych i rejestrach podmiotów wykonujących zadania publiczne. Obecnie jednak tworzą one zasób wiedzy, który jest rozproszony” – napisano w uzasadnieniu projektu.

Część komentatorów argumentacja ta przekonuje. Ich zdaniem nowe przepisy pozwolą na kształtowanie polityk z różnych dziedzin życia, które będą oparte na dowodach uzyskanych z analizy wielkich zbiorów danych (z ang. evidence based policy).

– Premier lub wskazane osoby mogą zwracać się z wnioskiem do podmiotów realizujących zadania publiczne o przekazanie danych, które posłużą do analiz polityk publicznych. Mogą to być np. dane dotyczące funkcjonowania domów opieki społecznej w zakresie odpowiedniego wsparcia ich beneficjentów, dane dotyczące jakości powietrza czy te dotyczące liczby osób wykonujących określone kategorie działalności gospodarczej. To zaledwie przykłady – w zasadzie każdy z podmiotów posiada dziesiątki czy setki zestawów danych opisujących różne zjawiska w kraju – przekonuje Krzysztof Izdebski, dyrektor programowy Fundacji ePaństwo.

Nie brakuje jednak również przeciwników nowych regulacji, zwłaszcza w zaproponowanym kształcie. Choćby ze względu na ich zakres.

– Dotyczą one wszystkich organów centralnych i samorządowych, a także podmiotów prywatnych, takich jak organizacje pozarządowe, które świadczą zadania publiczne. Rejestr REGON wskazuje ponad 111 tys. podmiotów zaliczanych do sektora publicznego, a zapewne kolejne kilka tysięcy to jednostki prywatne, które będą objęte tym obowiązkiem – zauważa Patryk Wachowiec, analityk prawny Forum Obywatelskiego Rozwoju.

– Co więcej, nie wiemy tak naprawdę, o jaki zakres danych chodzi. Czy wiadomości przychodzące na służbowe adresy e-mail albo zagregowane informacje z akt spraw sądowych mieszczą się w kategorii „zbioru lub rejestru”? To ogromne pole do nadużyć – ostrzega.

>>> Czytaj też: Glapiński: Po kryzysie nastąpią wojny gospodarcze. NBP jest na nie gotowy

Brak zabezpieczeń

Najwięcej obaw budzi jednak brak stuprocentowo skutecznych zabezpieczeń, które uniemożliwiałyby powiązanie przekazywanych danych z konkretną osobą.

– Widzę tu próbę powrotu do koncepcji jednolitego administratora danych osobowych w sferze publicznej, do której nie ma powrotu ze względu na RODO. Dlatego też chce się wprowadzić mechanizm udostępniania danych na żądanie administracji rządowej, opatrując go pozornym mechanizmem anonimizacji lub pseudoanonimizacji danych. Pozornym, bo nie ma żadnych standardów anonimizacji, czyli pozbawiania danych osobowych możliwości połączenia z osobą fizyczną, a pseudoanonimizacja z założenia jest działaniem odwracalnym. W efekcie nie mamy żadnych gwarancji, że ten mechanizm nie doprowadzi do udostępniania danych osobowych na bardzo szeroką skalę tam, gdzie takie udostępnienia nie powinny mieć miejsca – ocenia dr Paweł Litwiński.

Anonimizacja to zabieg mający trwale i nieodwracalnie wymazać dane osobowe, tak aby informacji w żaden sposób nie dało się z nimi powiązać. Tyle że nie wszyscy wiedzą, jak to zrobić. Tu gwarancję mogłyby dawać wspomniane przez dr. Pawła Litwińskiego standardy anonimizacji. Ich jednak nie przewidziano. Jeszcze gorzej, że dopuszczono również pseudoanonimizację. Ta bowiem z założenia jest odwracalna. Wystarczy mieć klucz, który pozwoli przywrócić dane osobowe i na nowo powiązać je z informacjami.

– Nie wyobrażam sobie, by np. pracownicy urzędów gmin lub dyrektorzy szkół mieli odpowiednią wiedzę i narzędzia pozwalające na skuteczne przekształcanie udostępnianych informacji, które zapobiegłyby identyfikacji konkretnych osób. Wbrew pozorom, przy tak ogromnych zbiorach danych powiązanie ich z konkretną osobą wciąż jest możliwe – uważa Patryk Wachowiec. Jako przykład podaje eksperyment przeprowadzony przez dziennikarzy „New York Times”, którzy badając zbiór 20 mln zapytań do wyszukiwarki AOL, udostępnionych w celach badawczych i pozbawionych adresów IP, zidentyfikowali 62-letnią wdowę ze stanu Georgia.

– Im więcej informacji i im bardziej są one różnorodne, tym większe ryzyko ich rozszyfrowania w oparciu o publicznie dostępne dane – podsumowuje analityk FOR.

Krzysztof Izdebski, choć entuzjastycznie nastawiony do pomysłu wykorzystania danych, również dostrzega pewne niebezpieczeństwa związane z odpowiednią anonimizacją.

– Będą o to musiały zadbać podmioty udostępniające dane i mam nadzieję, że staną one na wysokości zadania – komentuje.

Innym zagadnieniem są koszty związane z anonimizacją. Projekt nie przewiduje ich zwracania przez państwo, a nawet w przypadku średniej wielkości zbiorów trudno będzie się obejść bez specjalistycznego, a więc często drogiego oprogramowania. Koszty te będą musiały pokryć podmioty przygotowujące dane na żądanie KPRM. 

>>> Czytaj też: TSUE zamroził Izbę Dyscyplinarną. Rząd ma miesiąc, by wdrożyć środki tymczasowe