Archiwum kategorii ‘Bez kategorii’

Semantic school

czwartek, 27 Maj 2010

Od dłuższego czasu przyglądam się blogowi umieszczonemu pod adresem www.semanticschool.com .
Koledzy prowadzący ten blog postanowili przede wszystkim upowszechniać praktyczną wiedzę i umiejętności z zakresu semantic web. Konwencja “szkoły” czy raczej “kursu” z wyodrębnionymi wykładami i ćwiczeniami spotyka się z rosnącym zainteresowaniem ze strony czytelników.

Moim zdaniem to świetna inicjatywa i porządne wykonanie. Gratuluję kolegom wytrwałości i konsekwencji. Życzę im jednocześnie, aby pomimo zapewne wielu różnych innych zadań, znajdowali czas na regularne publikowanie postów. Sporo ludzi na to czeka. Trzymam za Was kciuki!

Z redaktorami bloga rozmawiamy o połączeniu naszych odmiennych, ale mających podobny cel, wysiłków poprzez wymianę treści na naszych blogach. Już wkrótce pewnie pierwsze efekty.

A póki co, polecam Szkołę Web 3.0!

Po konferencji OKCon 2010

czwartek, 13 Maj 2010

Cieszę się, że wziąłem udział w tej konferencji. Spośród wielu prezentacji wybrałem kilka, które najbardziej mnie interesowały. Dotyczyły one praktycznych zastosowań technologii semantic web w publikacji danych z sektora publicznego, aspektów prawnych (model licencjonowania) oraz społecznych konsekwencji otwartości danych.

Dla Brytyjczyków jest to rok sporego sukcesu w tym zakresie ponieważ uruchomili data.gov.uk. Pisałem o tym w jednym z wpisów na blogu SemWeb.pl. Wiele osób podczas swoich prezentacji odnoszących się do PSI (public sector information) wspominało o tym projekcie i o dostępie do zsemantyzowanych danych z domeny publicznej. Ciekawym aspektem poruszanym przez osoby, które opowiadały o swoich projektach związanych z publikowanie danych PSI, był opór ze strony urzędników oraz słabo jeszcze zbadany wpływ społeczny zapewnienia dostępu i możliwości ponownego wykorzystania danych.

“Open data” stało się mantrą przewijającą się w prezentacjach, dyskusjach, debatach, rozmowa prywatnych. Kilkakrotnie przywoływano potrzebę stworzenia prawa, które zapewniałoby otwartość (openness), dostępność (accessibility) i możliwość ponownego wykorzystania (re-usability) danych – stąd propozycja nazwy “Freedom of data” będąca oczywista analogią do “freedom of speech”.

Kolejnym interesującym zbiorem prezentacji były prezentacje poświęcone zastosowaniu otwartych form publikacji danych w świecie nauki. W tej działce wiodącym tematem były okryte ostatnimi czasy złą sławą dane z zakresu zmian klimatycznych. I tu pojawiła się bardzo ciekawa konkluzja, której najprościej ujmując brzmiała następująco: ważne jest nie tylko otwarte publikowanie danych wejściowych i wyjściowych różnych analiz naukowych (tu w kontekście danych klimatycznych), ale również otwartość kodu programistycznego aplikacji, które te dane przetwarzają i generują. Postulat bardzo ważny i jednocześnie wielkie wyzwanie.

Moja prezentacja dot. projektu Open Natura 2000, choć krótka (5 min.), spotkała się z dobrym przyjęciem. Miałem wrażenie, że na początku słuchaczy zaintrygował fakt, że program Natura 2000 jest tak dużą inicjatywą europejską, a oni nic o nim nie wiedzą. :) W kilku rozmowach, które przeprowadziłem po prezentacji moi rozmówcy docenili konstrukcje projektu (zaangażowanie uczelni, instytucji samorządowej i firmy komercyjnej) oraz jego merytorykę jednocześnie sugerując, żebyśmy możliwie szybko starali się o pozyskania zewnętrznego finansowania dla tego przedsięwzięcia. :) Już o tym myślimy.

Co jeszcze… A, może trochę informacji praktycznych. Materiały pokonferencyjne można znaleźć zarówno tutaj na stronie Open Knowledge Foundation jak i w Archiwum Internetowym.

OpenNatura2000 – semantyzujemy wybrane dane o obszarach Natura 2000

wtorek, 2 Marzec 2010

Rozpoczęliśmy pracę nad prototypem semantycznej bazy wiedzy o obszarach Natura 2000. Robocza nazwa projektu to OpenNatura2000. Wybraliśmy obszary Natura 2000 do naszego projektu ponieważ chcemy w ten sposób przetestować użyteczność udostępniania danych z domeny publicznej w formatach typowych dla technologii Semantic Web.

Cele nadrzędne projektu:

1. Udostępnienie wybranych danych o obszarach Natura 2000 w technologii Semantic Web

2. Wykazanie, że dzięki udostępnianiu baz wiedzy w technologii Semantic Web i łączeniu jej z innymi bazami wiedzy powstaje nowa jakość w sposobach prezentacji danych usprawniająca pozyskiwanie informacji, analizowanie danych, wnioskowanie itp. zarówno przez człowieka jak i aplikacje komputerowe.

3. Sprawdzenie użyteczności technologii/standardów Semantic Web jako “narzędzia” udostępniania wiedzy należącej do domeny publicznej.

Cele operacyjne:

1. zbudować bazę wiedzy na podstawie wybranych danych o obszarach Natura 2000 w Polsce i powiązać ją z innymi bazami wiedzy

2. wykonać aplikację agentową udzielającą dynamicznie odpowiedzi wywnioskowanych z faktów pochodzących z co najmniej trzech baz wiedzy w tym co najmniej jednej zewnętrznej (np. dbpedia – semantyczna wersja wikipedii).

Sposób realizacji:

1. zamodelowanie ontologii w języku OWL do reprezentowania wybranych danych pochodzących ze Standardowych Formularzy Danych obszarów Natura 2000

2. spopulowanie ontologii danymi zaimportowanymi z SDF

3. udostępnienie bazy wiedzy jako triplestore, prawdopodobnie z końcówką do składania zapytań w języku SPARQL

4. powiązanie bazy wiedzy z innymi bazami wiedzy (np. dbpedia, linked life data itp.)

5. stworzenie aplikacji agentowej wnioskującej na podstawie wiedzy pochodzącej z co najmniej trzech baz wiedzy (o aplikacji i stawianych przed nią zadaniach napiszę wkrótce)

6. wykonanie prototypowej aplikacji edukacyjnej udostępnionej poprzez stronę internetową obrazującą potencjał rozwiązania.

Zaangażowane podmioty:

1. zespół badawczo-rozwojowy mediaSELF.pl – autor i główny wykonawca projektu

2. Wydział Elektroniki i Informatyki Politechniki Koszalińskiej - współpraca naukowa

3. Słowiński Park Narodowy – współpraca merytoryczna.

Jako ciekawostkę warto dodać, że w trakcie realizacji projektu powstaną 3 prace magisterskie. Będą one pisane przez dyplomantów WEiI Politechniki Koszalińskiej.