Krótko:
zainteresowanym tematyką otwartych danych polecam: Transparency Camp Polska. Do zobaczenia
Wpisy otagowane ‘domena publiczna’
Transparency Camp Polska
poniedziałek, 18 Październik 2010Polska pozwana przez Komisję Europejską w sprawie PSI
piątek, 25 Czerwiec 2010No i stało się.. Polska już dwa lata temu otrzymała żółtą kartkę od Komisji Europejskiej za opieszałość we wdrażaniu aktów prawnych w oparciu o Dyrektywę dotycząca dostępności informacji z sektora publicznego (PSI). Niespełna miesiąc temu pisałem o tym na jakim etapie jesteśmy.
Tym razem Polska została pozwana przed Trybunał Sprawiedliwości.
Debata “Polska Otwarta” i co to jest “re-use”…
piątek, 5 Marzec 20101 marca w Collegium Civitas w Warszawie odbyła się debata Ośrodka Badań nad Przyszłością Collegium Civitas i Instytutu Obywatelskiego PO RP pod nazwą “Polska Otwarta”.
Zainteresowała mnie ponieważ kluczowym tematem debaty była kwestia tzw. domeny publicznej. Temat domeny publicznej zainteresował mnie z kolei w kontekście projekt OpenNatura2000, o którym pisałem w poprzednim poście. Idąc tym tropem po rozmowie z kilkoma osobami zaangażowanymi w temat (przy okazji dziękuję tym, którzy w ostatnich dniach poświęcili mi parę chwil) dotarłem do zagadnienia o tajemniczej etykiecie “re-use”.
O co w tym wszystkim chodzi? Gdzie leży interesujący mnie punkt styku pomiędzy tymi tematami. Krótko:
a. public domain, czyli domena publiczna to, syntetyzując jej definicję, wszelkie wytwory, z których można korzystać swobodnie bez ograniczeń wynikających z praw autorskich. Temat oczywiście jest bardzo obszerny a zainteresowanych zachęcam póki co do własnych poszukiwań – za słabo jeszcze czuję się w temacie, żeby coś konkretnego sugerować. Można zacząć od Wikipedii, w której jest kilka ciekawych linków np. do stanowiska UNESCO w tym temacie. Dla mnie na razie kluczowe było to, że dane należące do sektora publicznego w znacznej części powinny znaleźć się w domenie publicznej. W projekcie OpenNatura2000 takimi danymi są moim zdaniem dane zawarte w standardowych formularzach danych.
b. “re-use” to termin wchodzący w skład nazwy dyrektywy unijnej odnoszącej się do ponownego wykorzystania informacji z sektora publicznego. Dyrektywa ta zawiera wskazówki i zobowiązania dla państw członkowskich odnośnie do kwestii udostępniania informacji z sektora publicznego. I tu znowu zwróciło to moją uwagę w kontekście obecnie interesujących mnie danych na temat obszarów Natura2000, ale oczywiście zakres tych danych jest gigantyczny. Ministerstwo Spraw Wewnętrznych i Administracji prowadzi obecnie projekt ustawy o ponownym wykorzystaniu informacji z sektora publicznego – szczegóły założeń oraz zbiór uwag można znaleźć tutaj. Tu z kolei można sprawdzić stan wdrożenia tej dyrektywy unijnej. Tematyce “re-use” sporo miejsca poświęca również Piotr Waglowski w swoim serwisie prawo.vagla.pl.
c. Kilka krajów traktuje temat upubliczniania danych z sektora publicznego bardzo poważnie. Dwa świetne przykłady to amerykański data.gov i brytyjski data.gov.uk. Warto zajrzeć. W obydwu przypadkach uzyskujemy dostęp do olbrzymich ilości zbiorów danych upublicznionych w otwartych formatach (csv, xml). Genialne! Z mojej perspektywy bardzo interesujące jest to, że Brytyjczycy udostępnili końcówkę do składania zapytań w SPARQL czyli witamy w świecie Semantic Web (nic dziwnego – maczał w tym palce Tim Berners-Lee – znany orędownik standardów SW).
Otóż generalnie o technologie mi chodzi. To świetnie, że kierunek “Give me raw data now!” został wyraźnie obrany przez instytucje unijne i odpowiednie organy w wielu państwach. Bardzo ważne jest jednak, ale walczyć o świadomość technologiczną wśród ustawodawców pokazując im jaką wartość ma “re-use” plików jpg czy zamkniętych pdf’ów ze skanami dokumentów, a jaką ma wartość kiedy wystawimy dane choćby w zwykłym csv.
OpenNatura2000 – semantyzujemy wybrane dane o obszarach Natura 2000
wtorek, 2 Marzec 2010Rozpoczęliśmy pracę nad prototypem semantycznej bazy wiedzy o obszarach Natura 2000. Robocza nazwa projektu to OpenNatura2000. Wybraliśmy obszary Natura 2000 do naszego projektu ponieważ chcemy w ten sposób przetestować użyteczność udostępniania danych z domeny publicznej w formatach typowych dla technologii Semantic Web.
Cele nadrzędne projektu:
1. Udostępnienie wybranych danych o obszarach Natura 2000 w technologii Semantic Web
2. Wykazanie, że dzięki udostępnianiu baz wiedzy w technologii Semantic Web i łączeniu jej z innymi bazami wiedzy powstaje nowa jakość w sposobach prezentacji danych usprawniająca pozyskiwanie informacji, analizowanie danych, wnioskowanie itp. zarówno przez człowieka jak i aplikacje komputerowe.
3. Sprawdzenie użyteczności technologii/standardów Semantic Web jako “narzędzia” udostępniania wiedzy należącej do domeny publicznej.
Cele operacyjne:
1. zbudować bazę wiedzy na podstawie wybranych danych o obszarach Natura 2000 w Polsce i powiązać ją z innymi bazami wiedzy
2. wykonać aplikację agentową udzielającą dynamicznie odpowiedzi wywnioskowanych z faktów pochodzących z co najmniej trzech baz wiedzy w tym co najmniej jednej zewnętrznej (np. dbpedia – semantyczna wersja wikipedii).
Sposób realizacji:
1. zamodelowanie ontologii w języku OWL do reprezentowania wybranych danych pochodzących ze Standardowych Formularzy Danych obszarów Natura 2000
2. spopulowanie ontologii danymi zaimportowanymi z SDF
3. udostępnienie bazy wiedzy jako triplestore, prawdopodobnie z końcówką do składania zapytań w języku SPARQL
4. powiązanie bazy wiedzy z innymi bazami wiedzy (np. dbpedia, linked life data itp.)
5. stworzenie aplikacji agentowej wnioskującej na podstawie wiedzy pochodzącej z co najmniej trzech baz wiedzy (o aplikacji i stawianych przed nią zadaniach napiszę wkrótce)
6. wykonanie prototypowej aplikacji edukacyjnej udostępnionej poprzez stronę internetową obrazującą potencjał rozwiązania.
Zaangażowane podmioty:
1. zespół badawczo-rozwojowy mediaSELF.pl – autor i główny wykonawca projektu
2. Wydział Elektroniki i Informatyki Politechniki Koszalińskiej - współpraca naukowa
3. Słowiński Park Narodowy – współpraca merytoryczna.
Jako ciekawostkę warto dodać, że w trakcie realizacji projektu powstaną 3 prace magisterskie. Będą one pisane przez dyplomantów WEiI Politechniki Koszalińskiej.