Wpisy otagowane ‘open data’

OpenNatura2000 – pierwsza odsłona projektu.

wtorek, 7 Czerwiec 2011

Na razie skromnie odsłaniamy interfejs do semantycznej przeglądarki wiedzy powstającej w ramach projektu OpenNatura2000. O projekcie można poczytać w jednym z wcześniejszych wpisów tutaj. Można też spojrzeć na video z krótkiej prezentacji z ubiegłorocznego Transparency Camp.

Źródłem danych jest przede wszystkim dbpedia (niestety na razie nie polska – wkrótce pewnie się przełączymy) i freebase oraz nasza własna zsemantyzowana baza wiedza o obszarach Natura 2000 w Polsce. Wkrótce powstanie wydanie obejmujące wszystkie obszary Natura 2000 na terenie całej Europy. Przedstawiony prototyp pokazuje w jaki sposób można pozyskać nową wiedzę wywiedzioną z połączenia wiedzy wystawionej w kilku różnych bazach wiedzy.

Zapraszam do grupy Semantic Web na Goldenline i do dyskusji o projekcie.

Rozważamy rozwój projektu w modelu community development. Może kogoś zainteresuje udział w projekcie… :) Sporo pewnie będzie można się nauczyć.

Po spotkaniu “OpenData: apps for everyone?” w Berlinie

sobota, 26 Luty 2011

W ubiegłym tygodniu (18 lutego) wybrałem się na spotkanie “OpenData: apps for everyone?” do Berlina. Wydarzenie było organizowane przez Online Consultants International, Open Data Network, ePSIplatform, GEOkomm, Open Knowledge Foundation Deutschland, PSI Alliance. Szczerze mówiąc jadąc do Berlina liczyłem na to, że mowa będzie głównie o aplikacjach. Chciałem zobaczyć przykłady działających aplikacji wykorzystujących otwarte dane z sektora publicznego, posłuchać o doświadczeniach twórców tych aplikacji, dowiedzieć się jak żyją te aplikacje wśród użytkowników, czy udostępnianie danych PSI i aplikacji na nich opartych ma jakiś wymierny wpływ społeczny, biznesowy itp. Pod tym względem jestem rozczarowany. Nie doczekałem się prezentacji konkretnych przykładów i dyskusji o nich. W gruncie rzeczy dyskusje w części ogólnej dotyczyły kwestii najbardziej generalnych – generowanie PSI, udostępnianie, opłaty, modele biznesowe itp. Rzeczy bardzo istotne, ale słyszane przeze mnie wielokrotnie. Trochę ciekawiej zrobiło się w części warsztatowej. Co prawda mowy o konkretnych aplikacjach też nie było zbyt wiele na warsztacie, na który poszedłem, ale zebrałem pokaźną listę linków, które warto odwiedzić..

Ale… nudno nie było. :) Dla mnie kluczowe przesłanie z tego spotkania to przede wszystkim świadomość, że open data i open PSI to nie są tylko sezonowe mody. To konsekwentnie realizowana strategia wspierania tworzenia społeczeństwa obywatelskiego i budowa tzw. kapitału społecznego.
Kolejną bardzo ważną dla mnie informacją było potwierdzenie, że technologia semantic web, a w szczególności wykorzystanie RDF, jest silnie wspierane przez kilka znaczących projektów europejskich co może oznaczać przyjmowanie się standardu. Tym bardziej, że obecny na spotkaniu przedstawiciel W3C prezentował rekomendacje dotyczące wykorzystania RDF dla publikowania danych PSI. Biorąc pod uwagę inne europejskie projekty zmierzające do uzyskania wysokiej interoperacyjności danych PSI w oparciu o semantic web, można spodziewać się, że prawdziwy rozkwit SW jeszcze przed nami.

Podczas spotkania zaprezentowany też został nowy zespół, który przejmuje ePSIplatform.

W kuluarach spotkałem się m.in. z Jonathanem Grayem z Open Knowledge Foundation i zaprezentowałem mu bieżący stan projektu Open Natura 2000. Został on przyjęty dość entuzjastycznie. Będziemy wkrótce rozmawiać o ewentualnym wspólnym rozwoju tego projektu.

Co słychać…

czwartek, 13 Styczeń 2011

Straciłem ostatnio kontakt z tym blogiem. :) A kilka ciekawych rzeczy wydarzyło się od listopada. Krótko podsumuje:

18 listopada wybrałem się na Transparency Camp Warsaw. Miałem tam krótką prezentację projektu Open Natura 2000. Można ją nawet zobaczyć online tutaj. O swoich wrażeniach napisałem na gościnnym blogu w ePSI Platform tutaj.

Z kolei 29 listopada zostałem zaproszony do wzięcia udziału w konferencji Open Data and Re-use: what is happening at local levels in Europe?, która odbyła się w Rennes we Francji. Tam też miałem prezentację projektu Open Natura 2000. Ogólnie, sporo ciekawych prezentacji choć zdecydowana większość dotyczyła spraw administracyjnych i prawnych związanych z publikacją otwartych danych sektora publicznego. Niestety, nie było tam żadnych samorządowców z Polski. :(

I jeszcze jeden krótki news. Kończymy prace nad pilotażowym projektem Open Natura 2000. W ciągu najbliższych dni powinniśmy już być w stanie pokazać rezultaty pracy.

Aha, 18 lutego w Berlinie odbędzie się ciekawa konferencja poświęcona głównie tworzeniu i przykładom aplikacji korzystających z otwartych danych. Myślę, że warto się tam wybrać.

Moja Polis – warto zajrzeć – dobre przykłady wykorzystania otwartych danych #2

sobota, 6 Listopad 2010

W serii dobrych przykładów wykorzystania otwartych danych polecam serwis MojaPolis.pl tworzony przez Stowarzyszenie Klon/Jawor. Choć to dopiero wczesna wersja beta, sporo już można zobaczyć. Proste i ciekawe wizualizacje danych pozyskanych chyba na razie głównie z GUS. Trzymam kciuki i życzę rozwoju.

Współpraca z ePSI Platform – cd.

poniedziałek, 1 Listopad 2010

Wspomniałem w majowym poście, że podjąłem współpracę z ePSI Platform. Jest to europejska organizacja finansowana ze środków Komisji Europejskiej dystrybuowanych w ramach programu eContentplus. Ze względów głównie czasowych moja współpraca sprowadza się wyłącznie do korespondencji i informowania redaktorów o istotnych sprawach dziejących się w Polsce i dotyczących tematyki danych z sektora publicznego. Zaproszono mnie również do gościnnego współtworzenia bloga więc od czasu do czasu będą tam się pojawiały moje wpisy. Pewnie będą częściowo pokrywały się z tym o czym piszę tutaj.
Ostatnio zaproponowano mi udział w konferencji, która odbędzie się w Rennes, we Francji. Będę miał na niej krótką prezentację na temat projektu Open Natura 2000, o którym pisałem wcześniej tutaj. Cieszę się, że będę mógł ponownie opowiedzieć o projekcie. Być może znajdą się zainteresowani udziałem/współorganizacją/współfinansowaniem kolejnych etapów projektu.

Odświeżający model dziennikarstwa – oparty na faktach ;)

poniedziałek, 1 Listopad 2010

Wielokrotnie z przyjaciółmi rozmawiałem o tym jak wielkie możliwości daje Internet oraz otwarta publikacja zbiorów różnych danych w otwartych formatach w odniesieniu do poprawy rzetelności dziennikarskiej. W dyskusjach wyobrażaliśmy sobie, że dziennikarze opisujący, komentujący, argumentujący itp., powołują się na konkretne dane i wskazują źródło tych danych. Dzięki temu po pierwsze dużo łatwiej byłoby odnieść się do rzetelności tzw. “research’u” czy poddać dalszej analizie poruszaną kwestię.

I oto, proszę bardzo. Konstytuuję się nam nowy rodzaj dziennikarstwa tzw. “data journalism” lub “data driven journalism” czyli “dziennikarstwo oparte na danych”. Za kilka dni w Berlinie odbędzie się pierwsze spotkanie dziennikarzy zainteresowanych tą tematyką, a w grudniu kolejne. To póki co skromne wydarzenie, ale od czegoś trzeba zacząć. Realizacji koncepcji dziennikarstwa opartego na wykorzystaniu otwartych zbiorów danych już jest do podejrzenia. Póki co chyba najlepszym przykładem jest brytyjski Guardian i jego data blog. Warto też zajrzeć do open data blog niemieckiego Zeita.

W skrócie, chodzi o to, że pisząc artykuł na wybrany temat (np. wypadki drogowe) odwołujemy się i interpretujemy konkretne dane. Podajemy adresy tych zbiorów danych lub wręcz dołączamy je w otwartych formatach (dokument tekstowy, arkusz kalkulacyjny) do napisanego artykułu. Dzięki temu czytelnik może sam zweryfikować dane i co więcej, poddać je dalszej analizie. Moim zdaniem, takie podejście do dziennikarstwa będzie sprzyjało poprawie jakości informacyjnej i intelektualnej publikowanych artykułów. Już choćby patrząc na to co w ostatnich miesiącach dzieje się w Polsce i w mediach relacjonujących te zdarzenia, widać jak różna i racjonalniejsza mogłaby być publiczna debata, gdyby dziennikarze, publikując swoje artykuły, pokazywali dane, na które się powołują lub do których się odnoszą. Oczywiście uproszczeniem byłoby stwierdzenie, że taka forma dziennikarstwa jest dobra na wszelkie okazje, ale przyznaję, że dla mnie to odświeżająca perspektywa.

Podczas konferencji w Londynie, o której pisałem tutaj, poznałem Jonathana Graya. Polecam jego krótką, ale treściwą prezentację w języku angielskim na temat ‘data driven journalism’ (poniżej).

Zachęcam też do odwiedzenia http://datadrivenjournalism.net/

Czy ktoś coś wie o polskich inicjatywach podobnych do data blog w Guardian?

Podsumowanie ogólne Open Access Week przez SPARC

piątek, 29 Październik 2010

Zakończył się światowy Open Access Week. Globalne podsumowanie i wnioski znajdują się tutaj na stronach SPARC.

Postaram się zachęcić polskich uczestników/organizatorów wydarzeń w ramach tygodnia otwartego dostępu do opublikowania podsumowań. Warto od czasu do czasu zajrzeć tutaj.

Transparency Camp Polska

poniedziałek, 18 Październik 2010

Krótko:
zainteresowanym tematyką otwartych danych polecam: Transparency Camp Polska. Do zobaczenia ;)

Open Access Week 2010

czwartek, 14 Październik 2010

Już po raz czwarty, od 18 do 24 października, ruszy globalne wydarzenie pod nazwą Open Access Week. Celem akcji jest budowanie świadomości w kwestii wartości jaką tworzy otwarte dzielenie się wynikami badań naukowych. Koordynatorzy projektu wzywają do powszechnego, otwartego, wolnego/darmowego (tu mam wątpliwość, bo używają angielskiego słowa “free”) dostępu online do wyników badań oraz do prawa do ponownego wykorzystania (re-use) tych wyników w dowolny sposób. O projekcie można przeczytać więcej tutaj.

Inicjatywa polega na organizowaniu konferencji, seminariów, spotkań, dyskusji i wszelkich innych małych i dużych form aktywności zmierzających do popularyzacji postulatu “Open Access”. Polacy też utworzyli póki co małą grupkę, która stara się w miarę możliwości wesprzeć akcję w Polsce. To dobry czas – sporo zaczyna się w Polsce mówić o otwartości danych i ponownym ich wykorzystaniu. Niech Open Access Week 2010 będzie kolejnym bodźcem.

O tym jak istotne mogą być otwarte dane dla rozwoju np. nauk medycznych pisałem już wcześniej tutaj. Kolejnym dobrym przykładem jest inicjatywa gromadzenia i upowszechniania rzetelnych zbiorów danych i wiedzy na temat raka piersi, którą można znaleźć tutaj i przeczytać krótki komentarz do tej inicjatywy tutaj.

Jak dziś wygląda Giant Global Graph – wersja po kolejnym roku rozwoju Semantic Web

środa, 13 Październik 2010

Natrafiłem niedawno na najświeższą wersję diagramu, który prezentuje obecny stan chmury połączonych otwartych danych zwanej The Linking Open Data cloud. Ten byt znany jest również jako Giant Global Graph (GGG) o czym pisałem na innym blogu tutaj. Poniżej treści tego posta zamieszczam cytat tamtego posta żeby lepiej określić kontekst.

Dziś diagram wygląda tak (żeby przejść do źródła i powiększyć kliknij obrazek):

LOD

LOD

Co bardzo cieszy, graf zbiorów danych w otwartych formatach wzrósł ponad dwukrotnie od ubiegłego roku i jest to dynamika utrzymująca się już kolejny rok. Szczegóły można znaleźć tutaj.

A tu obiecany cytat:

www kontra GGG
24 Marzec 2010

Właśnie sobie uświadomiłem, że nie napisałem dotychczas o jednym z kluczowych haseł, które propaguje konsorcjum W3C, a w szczególności Tim Berners-Lee, w ramach upowszechniania koncepcji Semantic Web. Jest nim skrót GGG, którego rozwinięcie brzmi Giant Global Graph.

Pod koniec listopada 2007 Sir Tim użył tego zwrotu na swoim blogu. W zamyśle autora słowo Graph jest logicznym następcą swoich dwóch poprzedników czyli Net (sieć komputerów, bardziej kojarzona jako sieci lokalne lub o węższym zasięgu), Web (to co dziś nazywamy Internet, sieć treści i prostych usług). Wyjaśnia w swoim poście skąd pomysł na takie określenie. Warto przeczytać. Oczywiście pomysł na GGG jest trochę w myśl marketingowej zasady: produkt musi mieć dobrą nazwę. :) No cóż, sensowne idee też trzeba jakoś skutecznie sprzedawać. Można próbować pod marką Semantic Web lub Linked Data lub GGG.

Z pewnością użycie słowa graf wynika z graficznej reprezentacji osiowej koncepcji Semantic Web czyli tzw. trójek: dwa węzły grafu reprezentujące podmiot i dopełnienie oraz łącząca je linia/strzałka czyli krawędź grafu czyli orzeczenie.

Tak samo jak można reprezentować pojedyncze zdania/trójki przy użyciu grafu, można również reprezentować powiązania pomiędzy zbiorami trójek czyli triplestore’ami. Zatem połączone triplestore’y tworzą graf.

Rozrastający się graf powiązań pomiędzy danymi zgromadzonymi w różnych triplestore’ach to Gigantyczny Globalny Graf, czyli Giant Global Graph czyli GGG. :) Swoją drogą, ciekawe czy przyjmie się subdomena ggg (np. ggg.sejm.gov.pl) jako metoda adresowania np. SPARQLowych końcówek :)

A wracając do Sir Tim’a i mojego poprzedniego posta, niedawno tutaj, na TED.com, podsumował swój kolejny rok ewangelizowania temacie Semantic Web.

Bank Światowy udostępnia otwarte dane – dobre przykłady publikowania #2

czwartek, 15 Lipiec 2010

Czas na kolejny wpis pokazujący dobry przykład z zakresu publikacji otwartych danych.

20 kwietnia 2010 Bank Światowy utworzył na swoich stronach internetowych dział zawierający mnóstwo otwartych danych. W swoim opisie projektu Bank napisał m.in.:

The World Bank recognizes that transparency and accountability are essential to the development process and central to achieving the Bank’s mission to alleviate poverty. The Bank’s commitment to openness is also driven by a desire to foster public ownership, partnership and participation in development from a wide range of stakeholders. As a knowledge institution, the World Bank’s first step is to share its knowledge freely and openly.

czyli

Bank Światowy zauważa, że przejrzystość danych i odpowiedzialność za nie są fundamentalne dla rozwoju oraz kluczowe dla osiągnięcia misji Banku jaką jest walka z ubóstwem. Zaangażowanie Banku w otwartość wynika również z potrzeby zwiększenia publicznej własności, partnerstwa i uczestnictwa w rozwoju ze strony różnych zainteresowanych podmiotów. Pierwszym krokiem Banku Światowego, jako instytucji opartej na wiedzy, jest swobodne i otwarte dzielenie się tą wiedzą.

Zachęcam do eksploracji potężnych ilości danych. Przy okazji, zwraca uwagę mnogość formatów w jakich dostarczane są dane oraz udostępnienie API dla developerów.

Poniżej komunikat Prezesa Banku Światowego Roberta B. Zoellick’a na temat otwarcia danych Banku Światowego.

Miejmy nadzieję, że już wkrótce będziemy oglądać takie serwisy w Polsce.