Archiwum z Wrzesień 2010

Otwarte dane prowadzą do postępów w rozwiązywaniu problemów choroby Alzheimera – dobre przykłady publikowania #3

poniedziałek, 6 Wrzesień 2010

Czas na kolejna porcję inspiracji w zakresie zasadności publikowania otwartych danych. Tym razem z dziedziny medycyny. Poniżej zamieszczam cytat z artykułu z New York Times a tu link do oryginału.

Sharing of Data Leads to Progress on Alzheimer’s
By GINA KOLATA

In 2003, a group of scientists and executives from the National Institutes of Health, the Food and Drug Administration, the drug and medical-imaging industries, universities and nonprofit groups joined in a project that experts say had no precedent: a collaborative effort to find the biological markers that show the progression of Alzheimer’s disease in the human brain.

Now, the effort is bearing fruit with a wealth of recent scientific papers on the early diagnosis of Alzheimer’s using methods like PET scans and tests of spinal fluid. More than 100 studies are under way to test drugs that might slow or stop the disease.

And the collaboration is already serving as a model for similar efforts against Parkinson’s disease. A $40 million project to look for biomarkers for Parkinson’s, sponsored by the Michael J. Fox Foundation, plans to enroll 600 study subjects in the United States and Europe.

The work on Alzheimer’s “is the precedent,” said Holly Barkhymer, a spokeswoman for the foundation. “We’re really excited.”

The key to the Alzheimer’s project was an agreement as ambitious as its goal: not just to raise money, not just to do research on a vast scale, but also to share all the data, making every single finding public immediately, available to anyone with a computer anywhere in the world.

No one would own the data. No one could submit patent applications, though private companies would ultimately profit from any drugs or imaging tests developed as a result of the effort.

SISP – odpowiedź z GUS

poniedziałek, 6 Wrzesień 2010

Kilka dni temu otrzymałem odpowiedź z GUS na moje pytania dotyczące projektu SISP, o którym napisałem w jednym z niedawnych wpisów.

Oto ona:

1. jaki jest bieżący stan realizacji projektu SISP szczególnie w kontekście zadań z pierwszego obszaru (http://www.stat.gov.pl/cois/114.htm) ?

W chwili obecnej dostępne jest Studium Wykonalności obejmujące wszystkie 13 zadań projektu SISP. W zakresie obszaru pierwszego przygotowany został SIWZ dla systemu SMS (System Metadanych Statystycznych), co pozwoli na przeprowadzenie w najbliższym okresie przetargu na wspomniany system. W kolejnych miesiącach tego roku będą przygotowywane dokumenty SIWZ dla innych systemów. W obszarze pierwszym zakładamy następującą kolejność realizacji tych systemów: HDS (Hurtownia Danych Statystycznych), SWAiD (System Wspomagania Analiz i Decyzji), PHD (Publiczna Hurtownia Danych).

Powstał także portal edukacyjny: http://www.edustat.com.pl/.

2. jaki będzie konkretny rezultat projektu w ramach zadań z pierwszego obszaru (http://www.stat.gov.pl/cois/114.htm)? Z czego konkretnie będzie mógł skorzystać np. student? Jakie interfejsy użytkownika, narzędzia filtrujące itp. zostaną zaproponowane – jeśli w ogóle. W jakich formatach przewidujecie Państwo udostępnianie zbiorów danych?

Celem projektu SISP było m.in. umożliwienie dostępu do informacji statystycznych podmiotom życia społeczno-gospodarczego i obywatelom. Dostęp do tej informacji będzie możliwy w takim zakresie w jakim pozwala na to ustawa o statystyce publicznej uwzględniająca w szczególności konieczność zachowania tzw. „tajemnicy statystycznej”. Oznacza to, że ogólnie dostępne będą dane zgromadzone w Publicznej Hurtowni Danych (dane umieszczone w Hurtowni Danych Statystycznych – HDS – będą dostępne jedynie statystykom GUS). Częścią PHD będzie obecnie funkcjonujący i dostępny w Internecie Bank Danych Regionalnych (BDR). Bank ten zostanie rozbudowany do poziomu miejscowości i będzie funkcjonował jako Bank Danych Lokalnych (BDL).

System Wspomagania i Decyzji umożliwi łatwiejszy i przyjaźniejszy dostęp do tych danych poprzez wykorzystanie m.in. systemów klasy Business Intelligence (BI). Istotne będzie także powiązanie prezentowanych danych z metainformacją, co m.in. ułatwi dostęp do właściwych danych i umożliwi poprawną interpretację uzyskanych danych.

Pytanie o konkretne narzędzia i interfejsy użytkownika jest przedwczesne ponieważ będzie to wynikiem z jednej strony przetargu, a z drugiej realizowanego projektu. Na obecnym poziomie można mówić o pulpitach informacyjnych (dashboards) umożliwiających różnorodne zobrazowanie uzyskanych danych (tabele, grafy, diagramy, mapy).

Dane będą udostępniane przez Internet, natomiast dla wybranych użytkowników będzie możliwe zautomatyzowane pozyskiwanie danych wykorzystując usługi sieciowe (Web services), podobnie jak już obecnie jest udostępniany rejestr TERYT.

I jeszcze jedno pytanie bardziej ogólne:

3. Czy znany jest Państwu projekt data.gov.uk i czy zamysł stojący za SISP w kontekście zadań z pierwszego obszaru jest podobny do tego co zostało wykonane w ramach data.gov.uk.

Podczas budowy systemu informacyjnego będziemy korzystali z doświadczeń różnych instytucji i organizacji, także międzynarodowych. Takich przykładów jak wspomniany http://data.gov.uk/

jest więcej np. strony UN dające bezpośredni dostęp do baz danych http://w3.unece.org/pxweb/Dialog/, czy strony Eurostatu http://epp.eurostat.ec.europa.eu/portal/page/portal/eurostat/home/.

Dziękuję.

Dopytałem jeszcze o kilka kwestii dotyczących projektu (prawne i techniczne) więc kiedy tylko dostanę odpowiedź, zamieszczę na blogu.