WARSZTAT
BROKERA INFORMACJI
Mapowanie sieci.
Od początku istnienia
człowiek szuka informacji – od tej mającej mu zapewnić przeżycie – po tą, która
zapewnić mu ma odpowiednio wysoki poziom życia. Na przestrzeni wieków nasze
potrzeby informacyjne ewoluowały wprost proporcjonalnie do wymagań związanych z
egzystencją. Podobna sytuacja miała miejsce z narzędziami, które służyły do
pozyskania, przyswojenia i wykorzystania informacji. W zamierzchłych czasach
wystarczyło posłużyć się podstawowymi zmysłami aby wiedzieć gdzie znaleźć
pożywienie oraz jak zdobyć i utrzymać ogień. Dzisiaj potrzebne są wyrafinowane
narzędzia i metody, aby sprostać wymaganiom informacyjnym współczesnego
człowieka, który w ogromnym tempie i z zastraszającą determinacją dąży do
poprawy warunków swojej egzystencji i pozycji w społeczności w której żyje.
Kiedyś posiadanie informacji lub jej brak decydowały bezpośrednio o życiu lub
śmierci – dzisiaj bywa podobnie ale przede wszystkim informacja stanowi jeden z
kluczowych czynników decydujących o poziomie naszego życia. Obserwując wyścig
szczurów obecnej doby, dochodzę do wniosku, że wszechobecne dążenie do poprawy
bytu oraz wiążący się z tym awans społeczny stanowią co najmniej taką samą siłę
napędową jak pierwotny instynkt przetrwania. Dzisiaj o osiągnięciu powyższych
celów w dużej mierze decyduje posiadanie informacji – tej wartościowej, którą
cechuje adekwatność, kompletność, aktualność i wiarygodność, a nie tej, którą
często określamy mianem szumu informacyjnego.
Do niedawna głównym problemem było dotarcie do informacji. Obecnie w dobie
internetu i telefonii komórkowej jest to problem wtórny w stosunku do potrzeby
selekcji informacji oraz prawidłowej jej interpretacji. Nie jest to proste,
ponieważ jest jej tak wiele, że nikt obecnie nie jest w stanie określić ile jej
jest – tej tradycyjnej w postaci papierowej i tej wirtualnej – elektronicznej.
Współczesny człowiek codziennie bombardowany jest taką ilością informacji, z
którą człowiek żyjący 300 lat temu miał do czynienia przez całe swoje życie.
Ostatnie dane udostępnione przez jeden z najpopularniejszych serwisów
internetowych podają, że stron internetowych zarejestrowanych w ich bazach jest
ponad 19 miliardów. Oznacza to, że na 1 mieszkańca ziemi przypada ich obecnie
już kilka. Aby je wszystkie przeczytać potrzebnych byłoby ponad 6000 lat życia
spędzonych na ciągłym klikaniu, przy założeniu, że na każdą stronę/adres
poświęcilibyśmy 10 sekund lektury.
Skuteczna selekcja
informacji wymaga stałej (lub co najmniej długookresowej) dostępności źródeł
poszczególnych informacji. Takim źródłem jest niewątpliwie Internet. Istnieją
również inne elektroniczne źródła takie jak rejestry publiczne (ludność,
pojazdy, grunty, paszporty, cudzoziemcy), bazy danych dokumentów urzędowych
(zbiory dokumentów przechowywanych przez administrację publiczną, zbiory
dokumentów urzędowych Unii Europejskiej) i inne. Sama dostępność informacji nie
jest wystarczająca. Konieczna jest aktywność w zakresie poszukiwania, selekcji,
uwiarygodnienia i udostępnienia interesującej informacji.
Możemy wyróżnić dwa podstawowe typy potrzeb informacyjnych:
-
znalezienie określonej,
precyzyjnie zdefiniowanej informacji;
-
eksploracja dostępnej
informacji z określonej dziedziny/zakresu/obszaru wiedzy.
Do zaspokojenia pierwszego typu potrzeb wystarcza model usługi polegający na
jednorazowym wyprodukowaniu pojedynczego produktu. W tym przypadku
wystarczającymi zasobami jest osoba posiadająca umiejętności wyszukiwania
informacji oraz odpowiedni zestawem standardowych ogólnodostępnych narzędzi
(przeglądarka + wyszukiwarki internetowe).
Do zaspokojenia
drugiego typu potrzeb konieczne jest posiadanie tak wielu umiejętności,
interdyscyplinarnej wiedzy oraz posługiwanie się tak dużą ilością narzędzi
wspierających pracę, że wymusza to organizowanie pracy w ramach systemu. Dopóki
nie istnieją ogólnodostępne narzędzia informatyczne wykorzystujące sztuczną
inteligencję (porównywanie, kojarzenie, wnioskowanie), dopóty pomiędzy odbiorcą
informacji, a światowymi zasobami informacyjnymi, niezbędny będzie pośrednik,
który w literaturze tematu określany jest mianem brokera informacji. Rola
brokera informacji może sprowadzać się jedynie do wyszukania odpowiedniej
informacji tzn. zaspokajać pierwszy typ potrzeb. Obecnie, zwłaszcza na polskim
rynku informacji, taka jego rola w najbliższym czasie będzie wiodąca ale z
czasem będzie ewoluowała w kierunku zaspokajania drugiego typu potrzeb. W tym
drugim przypadku niezbędne będą rozwiązania systemowe w zakresie organizacji i
narzędzi.
W ramach organizacji powinno funkcjonować wielu specjalistów, a broker
informacji powinien stanowić centralny jej punkt i być odpowiedzialnym za
kontakt z klientem, koordynację pracy specjalistów oraz decyzje w zakresie
selekcji i opracowania materiału informacyjnego. W zakresie identyfikowania,
gromadzenia i wstępnej selekcji materiału informacyjnego, brokera powinni
wspierać specjaliści w zakresie wyszukiwania informacji, natomiast w zakresie
oceny adekwatności, analizy i uwiarygodniania – eksperci
dziedzinowi.
W zakresie narzędzi
potrzebne są zintegrowane systemy potrafiące w dużej części wyręczyć człowieka w
żmudnej pracy związanej z „obróbką” informacji. Wszelkie do tej pory opracowane
i udostępnione narzędzia tylko po części załatwiają sprawę. Proces wyszukiwania
i analizy informacji wymaga pracy odpowiednio przygotowanego specjalisty lub ich
grupy. Specjaliści muszą posiadać umiejętności i wiedzę z wielu obszarów,
poczynając od umiejętności posługiwania się narzędziami i znajomości źródeł
poprzez umiejętności z zakresu psychologii, socjotechniki i marketingu potrzebne
na etapie pozyskiwania informacji (bezpośredniej), po umiejętności analizy i
syntezy, kojarzenia i wnioskowania – potrzebne na etapie sporządzania
ostatecznych odpowiedzi.
Wszystko wskazuje na to, że oprogramowanie, które będzie w stanie realizować
wszystkie, a przynajmniej większość czynności realizowanych w ramach
wyszukiwania, analizy i udostępniania informacji, nie będzie szybko dostępne.
Pewne jest, że bez pomocy systemów zawierających elementy sztucznej inteligencji
nie będzie to możliwe. Systemów rzeczywiście posługujących się jej mechanizmami,
a nie tylko ją imitujące.
Aktualnie dostępnych jest wiele narzędzi, które wspierają brokera w ramach
poszczególnych procesów realizowanych w ramach jego pracy. Wyzwaniem jest
stworzenie takiego zestawu tych narzędzi, który pozwoli jak najefektywniej
wyręczać człowieka w realizacji stosunkowo prostych ale praco i czasochłonnych
zadań, pozostawiając mu czas na pracę koncepcyjno-analityczną. Pierwszą grupę narzędzi
funkcjonujących w ramach systemu stanowić powinny narzędzia wspierające procesy
związane z wyszukiwaniem i grupowaniem informacji.
Idealnym rozwiązaniem
byłaby implementacja w wyszukiwarkach takich mechanizmów, które pozwoliłoby na
zaspokajanie także drugiej z wymienionych potrzeb. Obecnie na proste pytania
wyszukiwarki odpowiadają listą tysięcy odnalezionych dokumentów. Użytkownik jest
zwykle w stanie przejrzeć kilkanaście czy kilkadziesiąt z nich. Osoba pragnąca
zgłębić określoną dziedzinę nie jest zainteresowana w pierwszej kolejności
studiowaniem indywidualnych dokumentów, lecz raczej ogarnięciem ich
całokształtu.
Od szeregu lat prowadzone są na świecie intensywne badania nad wizualizacją
zawartości i relacji semantycznych oraz reprezentacją mapową dużych zbiorów
dokumentów. W wyniku powyższych prac powstają systemy, których reprezentacja
znajduje się poniżej:
• automatyczne
grupowanie wyników wyszukiwania (dynamicznie kreowane kategorie)
• automatyczne
grupowanie wyników wyszukiwania (określona hierarchia kategorii)
–
excavio,
• dwuwymiarowe
graficzne mapy dokumentów odzwierciedlające bliskość koncepcyjną przez bliskość
geometryczną (samo organizujące się mapy)
–
BEATCA,
– System
Rainbows,
– ET,
• grafowa wizualizacja
klastrów dokumentów
–
Narcissus,
• wizualizacja
zależności cytowania między dokumentami
• mapy powiązań
dokumentów odzwierciedlające bliskość tematyczną przez bliskość do jądra
mapy
• grafy semantycznych
związków
• dynamiczne mapy
reprezentujące grupowanie dokumentów
–
maps.map.net.
Następną grupę narzędzi stanowią narzędzia do ekstrakcji informacji z
tekstów. O tych narzędziach jak również narzędziach wymienionych w niniejszym
tekście, traktował będzie kolejny artykuł, który zamieszczony zostanie już
wkrótce.
DARIUSZ FIJOŁEK
jest infobrokerem systemowym, kierownikiem wielu projektów w tym obszarze,
posiada kompetencje moderatora systemowego; jest trenerem i wykładowcą Ośrodka
Informatyki- Terenowego Banku Danych w Gdańsku.