Przegląd systemów sieciowego rozpowszechniania baz danych na CD-ROM

Andrzej Koziara
Biblioteka Uniwersytetu Śląskiego
Adres poczty elektronicznej jest chroniony przed robotami spamującymi. W przeglądarce musi być włączona obsługa JavaScript, żeby go zobaczyć.


Efektywne wykorzystanie potencjału CD-ROM-owych baz danych

Jak można zauważyć już od wielu lat biblioteki naukowe na całym świecie pełnią dwie komplementarne role. Pierwsza to udostępnianie zasobów własnych tak pracownikom jak i studentom macierzystych uczelni oraz wymiana zbiorów w ramach wypożyczeń międzybibliotecznych. Druga to dostarczanie wszechstronnej informacji naukowej niezbędnej do prowadzenia badań na kluczowych kierunkach uczelni oraz realizowania na wysokim poziomie nowoczesnej w swojej formie i treści dydaktyki.

W ciągu ostatnich dziesięciu lat w obydwóch sferach ogromna rolę odegrał lawinowy rozwój technologii informatycznych. Pierwsze z nich oparły się o lokalnie instalowane systemy biblioteczne, które w ostatnich latach udostępnione zostały poprzez sieć Internet. Natomiast rozwój informacji naukowej został zdeterminowany przez opracowanie i wdrożenie do wykorzystania w sprzęcie komputerowym powszechnego użytku czytników optycznych płyt kompaktowych (CD-ROM).

Po wstępnym okresie, kiedy główną rolę grała technika i technologia zapisu danych, rozpoczęła się era w której zaczęto prowadzić dokładną analizę wykorzystania dostarczanych w takiej postaci zasobów informacyjnych. Działania te zostały wymuszone przez wysokie ceny zakupu tak przygotowywanych baz danych. Jak się bardzo szybko okazało tylko i wyłącznie sieciowe rozpowszechnianie dostarczanych tą technologią baz danych uzasadniało tak wysokie nakłady finansowe ponoszone na ich zakup.

Bazując na doświadczeniach Śląskiego Konsorcjum Bibliotek Naukowych należy zwrócić uwagę na fakt, że zagadnienia które należało uwzględnić przy planowaniu jego działania powinniśmy podzielić na dwie grupy:

  • aspekty techniczne rozpowszechniania baz danych dostarczanych na nośnikach optycznych
  • aspekty organizacyjne rozpowszechniania baz danych dostarczanych na nośnikach optycznych

By w pełni zrozumieć wszystkie aspekty związane z sieciowym rozpowszechnianiem baz danych dostarczanych na nośniku optycznym należy sięgnąć do historii tej technologii.

I tak w wielkim skrócie możemy powiedzieć, że droga rozwoju rozpoczęła się od komputera PC z dołączonym zewnętrznym czytnikiem CD-ROM (1 speed tj. 150 KB/s), dochodząc w dniu dzisiejszym dla urządzeń wbudowanych w jednostki centralne o szybkościach przekraczających 40 speed.

W odniesieniu do konkretnych rozwiązań najlepiej to zilustrować poniższymi przykładami:

 

Wykres ilustrujący historię stanowisk lokalnych

 

 

Wykres ilustrujący aktualny obraz stanowisk lokanych (1999r.)


Charakterystyki te uzmysławiają nam podstawową bolączkę, która występuje przy takich tradycyjnych rozwiązaniach - użytkownik w dalszym ciągu, identycznie jak przy źródłach drukowanych przywiązany jest do miejsca składowania nośników informacji.

Monopol miejsca złamały dopiero wdrożenia systemu sieciowego rozpowszechniania zbiorów danych zawartych na krążkach optycznych. Systemy te rozwijały się podobnie jak następował rozwój technologii informatycznej i sprzętowej. Do chwili obecnej systemy te możemy podzielić na cztery kolejne generacje:

  1. CD-ROM (lub CD-ROM'y) podłączone jako fizyczne urządzenia do serwera sieciowego (najczęściej Novell Netware - widoczne analogicznie jak dodatkowe dyski twarde).

  2. Serwery CD-ROM'ów współpracujące z systemami sieciowymi (Novell Netware, Windows NT Server) obsługiwane przez programy dostępowe.

  3. Systemy sieciowego rozpowszechniania baz z przeładowywaniem baz danych na dyski twarde - wymagające instalacji specjalnego klienta.

  4. Systemy sieciowego rozpowszechniania baz z przeładowywaniem baz danych na dyski twarde - wykorzystujące w czasie logowania do systemu przeglądarki internetowe (Script Active X, Cookie).


Ad. 1 - Generacja pierwsza

Systemy te mimo że umożliwiały dystrybucję danych z CD-ROM'ów w sieciach lokalnych, charakteryzowały się, jak i ich epoka małą elastycznością oraz znacznymi ograniczeniami.

 

CD-ROM (lub CD-ROM'y) podłączone jako fizyczne urządzenia do serwera sieciowego


Działanie systemów tej generacji polegało na przyporządkowywaniu stałej litery (np. K,L,M,..S), każdemu zamontowanemu w serwerze napędowi CD-ROM. Zainstalowane na serwerze oprogramowanie do przeszukiwania baz danych sięgało do każdego zasobu danych korzystając z ww. przyporządkowania.

Do najważniejszych ograniczeń występujących w tych systemach należały:

  • Skończona, ograniczona ilością wolnych liter w systemie sieciowym liczba fizycznych napędów CD-ROM
  • Kłopoty z korzystaniem symultanicznym z zasobów pojedynczej płyty - bardzo wolne jak na realne potrzeby mechanizmy napędowe głowic


Ad. 2 - Generacja druga

Systemy oparte o specjalistyczne oprogramowanie umożliwiające dynamiczne przydzielanie aktualnie potrzebnych do udostępniania baz danych. W swoim końcowym okresie oprogramowanie ewoluowało w kierunku technologii klient serwer.

Schemat pracy systemu mógł przykładowo mógł wyglądać, jak zaprezentowano poniżej:

  • Baza nr 1
    Dysk 1 - K Dysk 2 - L Dysk 3 - M
  • Baza nr 2
    Dysk 1 - K Dysk 2 - L Dysk 3 - M
    Dysk 4 - N Dysk 2 - O Dysk 3 - P
  • Baza nr 3
    Dysk 1 - K Dysk 2 - L Dysk 3 - M
    Dysk 4 - N Dysk 2 - O

Przyjęcie rozwiązania tego typu rozszerzało możliwości systemów uzupełniając je o mechanizm publikowania wielu baz danych dostarczanych na kilku lub kilkunastu krążkach CD-ROM.

 

Systemy oparte o specjalistyczne oprogramowanie umożliwiające dynamiczne przydzielanie aktualnie potrzebnych do udostępniania baz danych

W systemach takich pozostawało jednak ograniczenie dotyczące szybkości pracy systemu przy symultanicznym wykorzystaniu tego samego krążka przez wielu użytkowników. Potęgowane było ono możliwościami fizycznego podłączania kolejnych wielu wież CD-ROM do sterujących nimi serwerów sieciowych.

Niedogodności te zostały zlikwidowane z chwilą pojawienia się kolejnej już trzeciej ich generacji.


Ad. 3 - Generacja trzecia

Rozwój technologii produkcji dysków twardych dużych pojemności, a co za tym idzie znaczny spadek ich ceny zainspirował projektantów i integratorów systemów informatycznych do stworzenia idei, w której głównym założeniem stało się przeładowywanie danych pochodzących z krążków CD-ROM na dyski twarde. Zaowocowało to znacznym przyspieszeniem dostępu do danych. Jak się okazało w praktyce nie istniało już ograniczenie sprzętowe, określające ilość równoczesnych użytkowników odczytujących dane pochodzące pierwotnie z jednej płyty optycznej.

Reprezentantem systemów tej generacji w Europie stał się InfoWare CD/HD stworzony koncepcyjnie i realizacyjnie przez firmę Info Technology Suplly z Londynu. W związku z pozyskaniem środków pochodzących z programu TEMPUS, system ten został zakupiony dla Górnośląskiego Konsorcjum Bibliotek Naukowych. Zawierał on trzy serwery stanowiące w swojej koncepcji rozwiązanie komplementarne dla użytkowników wykorzystujących łącza tak o dużej jak i o małej szybkości transmisji danych. Było to niezbędne, gdyż codziennością naukowych sieci komputerowych było występowanie "wąskich gardeł" zlokalizowanych głównie w nitkach transmitujących dane pomiędzy miastami.

 

Systemy sieciowego rozpowszechniania baz z przeładowywaniem baz danych na dyski twarde wymagające instalacji klienta

Wadą rozwiązań występujących w systemach tej generacji była występująca ciągle konieczność instalowania na stacji roboczej u każdego potencjalnego użytkownika specjalistycznego oprogramowania klienta niezbędnego do nawiązania łączności z serwerem InfoWare CD/HD. Dla prawidłowej pracy należało również dodatkowo zainstalować specjalistyczne oprogramowanie emulujące wirtualne CD-ROM'y zajmujące na stałe systemowe, identyczne u wszystkich użytkowników litery przyporządkowywane normalnie dyskom twardym.

Problemy występujące przy stałej cyklicznej wymianie tegoż oprogramowania stały się inspiracją do powstania nowej generacji systemów likwidujących te wady.


Ad. 4 - Generacja czwarta

Główną cechą charakteryzującą oprogramowanie systemów tej generacji stało się wykorzystanie do logowania się do serwera klasycznej przeglądarki internetowej (Internet Eksplorer lub Netscape - Sylaba Komunikator). Po uzyskaniu dostępu do systemu następuje na każdej stacji roboczej uruchomienie własnego, dostarczanego przez producenta bazy danych oprogramowania służącego do jej przeszukiwania.

Równocześnie systemy te zostały wyposażone w możliwości instalowania dowolnej ilości dysków twardych i wież CD-ROM, podłączania jukebox'ów oraz integrowania serwerów w klastry.

Przykładowa konfigurację systemu tej generacji przygotowana w oparciu o oprogramowanie IRIS CDWare - CDWebWare została przedstawiona na rysunku poniżej

 

Systemy sieciowego rozpowszechniania baz z przeładowywaniem baz danych na dyski twarde - wykorzystujące w czasie logowania do systemu przeglądarki internetowe (Script Active X, Cookie)

 

Omawiając systemy sieciowego rozpowszechniania baz danych nie możemy zapomnieć o tych, które są przygotowywane przez ich producentów. Znaczną niedogodnością ograniczającą ich zastosowanie jest fakt, że są one przystosowane tylko i wyłącznie do jednej stosowanej przez producenta bazy struktury danych. Użyteczność ich zastosowania jest głównie związana z ilością baz danych, które są one w stanie obsłużyć. Do znaczących ze względu na ilość i zakres tematyczny baz danych należy m.in. dostarczany przez Silver Platter system ERL.


Wracając jeszcze do wdrożonych systemów trzeciej generacji, należy stwierdzić że najciekawszym rozwiązaniem pracującym na terenie Polski jest system Urzędu Patentowego Rzeczypospolitej Polskiej.

System sieciowego rozpowszechniania baz danych z wykorzystaniem jukeboxów Urzędu Patentowego RP



Jak widać jest to jedyne miejsce, gdzie w praktyce wykorzystujemy urządzenia do wybierania i podawania krążków CD-ROM do czytników (jukebox). Zastosowano i uruchomiono tam zmieniacze zawierające 450 płyt, a w etapie wdrażenia jest podłączenie kolejnych 2 szt. mogących pomieścić równocześnie dalszych 1000 sztuk CD-ROM.

Omawiając najciekawsze wdrożenia systemu InfoWare CD/HD nie możemy zapomnieć o własnym pracującym na rzecz Uniwersytetu Śląskiego, Akademii Ekonomicznej w Katowicach oraz Uniwersytetu Opolskiego.

System sieciowego rozpowszechniania baz danych Konsorcjum Górnośląskich Ośrodków Akademickich

 

Zastosowano w nim kilka unikalnych rozwiązań, mogących posłużyć w tamtym okresie za wzorzec do naśladowania:

  • System wyposażono w dwa serwery z zainstalowanymi bazami danych:
    • główny przeznaczony do obsługi całego konsorcjum
    • pomocniczy przygotowany do przejmowania zadań głównego w przypadku znaczących zakłóceń w łączności pomiędzy Katowicami a Opolem
  • Przy serwerze głównym zlokalizowano serwer Telnet wyposażony w oprogramowanie pozwalające z sesji oprogramowania zdalnego telminala przeglądać bazy danych obsługiwane przez programy przeszukujące oparte na systemie DOS - rozwiązanie specjalizowane dla klientów wykorzystujących łącza modemowe
  • Stworzono system połączeń logicznych baz i użytkowników co umożliwiało bardzo dokładne monitorowanie ich wykorzystania
  • Wdrożono specjalny dedykowany kanał łączności dla sprawnej pracy systemu w Filii Uniwersytetu Śląskiego w Cieszynie
  • Zastosowano dynamicznie zmieniany zakres baz danych dla ośrodka Opolskiego

O klasie i popularności systemu InfoWare CD/HD świadczy szeroki jak na polskie warunki zakres jego wdrożeń poza Górnośląskim Konsorcjum Bibliotek Naukowych obejmujący:

  • Uniwersytet Mikołaja Kopernika w Toruniu
  • Uniwersytet Warszawski w Warszawie
  • Akademię Górniczo-Hutniczą w Krakowie
  • Centrum Superkomputerowe w Poznaniu,
  • Politechnikę Gdańską w Gdańsku
  • Urząd Patentowy w Warszawie

Jednakże na szczególną uwagę zasługują systemy generacji czwartej, których wdrożenie w naszym konsorcjum nastąpi w 1999 roku.

Ze względu na konieczne nakłady finansowe podjęliśmy decyzję, że w pierwszym etapie zostanie wdrożony system przeznaczony dla użytkowników podłączonych w ramach sieci lokalnych, miejskich opartych na technologii światłowodowej oraz tych MAN-ów, które zintegrowane są z naukową siecią komputerową POL-34. System ten noszący nazwę IRIS CDWare (InfoWare Remote Information Server) oparty został na technologii oprogramowania systemowego Microsoft Windows NT Server 4.0, Internet Information Server 4.0 oraz oprogramowaniu aplikacyjnym IRIS 4.0 integrującym się z systemem jako kolejna usługa serwera.

Tryb pracy klienta tegoż systemu jest następujący:

  • Otwarcie przeglądarki internetowej (IE 4.0 lub Netscape 4.0+ScriptActiveX) oraz połączenie się z adresem serwera IRIS. W czasie połączenia oprogramowanie IRIS dokonuje autoryzacji użytkownika na bazie jego nr IP porównując go z zasobami pliku uprawnień
  • Logowanie do systemu - uruchomienie bezpośredniej łączności z serwerem IRIS poprzez przeglądarkę internetową (możliwe do wybrania są następujące tryby pracy: bez dodatkowej autoryzacji, autoryzacja poprzez nazwę grupy użytkowników lub poprzez nazwę użytkownika i jego hasło)
  • Wybranie pozycji menu wskazującego na bazę danych
  • mapowanie w ramach sieci Microsoft dysku z oprogramowaniem przeszukującym bazę danych i dysków z danymi pochodzącymi z nośnika optycznego (do prawidłowego działania tej funkcji konieczne jest na starcie systemu Windows zalogowanie się do sieci Microsort Windows)
  • pobranie i uruchomienie bezpośrednio z serwera oprogramowania przeszukującego bazę danych dostarczanego indywidualnie do każdej z nich przez jej producenta
  • dokonanie żądanych przeszukiwań wraz z zapisem lub wydrukiem wyników przeszukiwań na stanowisku lokalnym
  • zakończenie działania tegoż oprogramowania - automatyczne odłączenie dysków z danymi i powrót do menu wyboru bazy danych
  • powtarzanie czynności od wyboru bazy danych przez wyszukiwanie do zamknięcia programu przeszukującego
  • wylogowanie z systemu


Uruchomienie systemu w tej konfiguracji przewidujemy w kwietniu bieżącego roku. Równocześnie na okres powakacyjny zaplanowaliśmy uruchomienie systemu w wersji IRIS CDWebWare zawierającego rozszerzenie o serwer aplikacyjny umożliwiający prace użytkowników łączących się do sieci POL-34 z sieci NASK lub innych łączy nie zapewniających właściwej szybkości transmisji danych. W koncepcji pracy systemu serwer aplikacyjny jest miejscem, gdzie uruchamiana jest oprogramowanie przeszukujące bazy danych, a do użytkownika przekazujemy tylko i wyłącznie wygląd ekranu z otwartej sesji programu. Użytkownik ma też możliwość dokonania zapis efektu przeprowadzonych wyszukiwań na lokalnych dyskach twardych i dyskietkach oraz wykonania żądanych wydruków.

W związku z powyższym tryb pracy systemu CDWebWare w stosunku do CDWare różni się tylko w następującym obszarze wykonywanych funkcji:

  • Wybranie pozycji menu wskazującego na bazę danych - automatyczne uruchomienie sesji na serwerze aplikacyjnym oraz otwarcie kanału łączności przekazującego ekrany, komendy druku oraz zapisu danych
  • mapowanie w ramach sieci Microsoft przez Serwer Aplikacyjny dysku z oprogramowaniem przeszukującym bazę danych i dysków z danymi pochodzącymi z nośnika optycznego
  • uruchomienie na Serwerze Aplikacyjnym oprogramowania przeszukującego bazę danych - do komputera klienta przekazywane są tylko skompresowane wyglądy ekranu, a nie ogromne pliki z danymi
  • zakończenie działania tegoż oprogramowania kończy sesję na Serwerze Aplikacyjnym
  • powtarzanie czynności od wyboru bazy danych przez wyszukiwani do zamknięcia programu przeszukującego
  • wylogowanie z systemu

Jak pokazała praktyka, o powodzeniu wdrożenia systemu sieciowego rozpowszechniania baz danych zadecydowały również właściwie zorganizowane systematyczne szkolenia użytkowników, szeroka informacja o możliwościach systemu oraz kompleksowo dobrany zakres tematyczny baz danych publikowanych w systemie.

Dla zapewnienia właściwego programu szkoleń pod względem treści i formy ich prowadzenia przygotowywaliśmy i prowadziliśmy je w następujących grupach:

  • pracownicy oddziałów informacji naukowej
  • pracownicy bibliotek wydziałowych i instytutowych
  • samodzielni pracownicy nauki
  • adiunkci i doktoranci
  • magistranci i studenci
  • grupy doraźnie organizowane w miarę zapotrzebowania czytelników

Ułatwieniem podczas ich prowadzenia były również specjalnie przygotowywane dla poszczególnych cykli szkoleń różne w swoim zakresie i zawartości menu użytkownika. Podczas ich projektowania stosowaliśmy następujące kryteria:

  • Menu wg producenta bazy: ISI, Silver Platter, UMI, Wilson, ..
  • Menu wg dziedziny wiedzy: bazy nauk ścisłych i technicznych, bazy nauk społecznych, bazy biologiczne, bazy ekonomiczne, bazy geograficzne, bazy medyczne oraz bazy prezentacyjne i pomocnicze
  • Menu wg zawartości bazy: bazy bibliograficzne, Polska Bibliografia Narodowa, katalogi wydawnicze, słowniki, encyklopedie, atlasy, inne bazy danych

Mimo upływu krótkiego czasu o premiery oprogramowania IRIS (Londyn grudzień 1998) system ten został już wdrożony w Polsce przez dwa konsorcja bibliotek naukowych:

  • System CDWebWare - Biblioteka Narodowa w Warszawie (dla konsorcjum 9 bibliotek Warszawy, Bydgoszczy i Krakowa)
  • System CDWare - Politechnika Wrocławska we Wrocławiu (dla uczelni miasta Wrocławia)


Jak widać z przytoczonych przykładów rozwój oprogramowania do sieciowego rozpowszechniania baz danych przebiega bardzo dynamicznie, a każdy upływający rok czyni systemy bardziej sprawnymi i przyjaznymi dla użytkownika. Ze względu na dynamikę w pojawianiu się nowości technicznych wszystkich zainteresowanych zapraszamy do naszej witryny WWW: http://www.bg.us.edu.pl


 

Góra
s2.jpg

Zapytaj bibliotekarza

Telewizja UŚ

Więc Jestem. Studencki serwis rozwoju