Next: Verteilte Suche Up: Einleitung Previous: Einleitung

Überblick über die Kapitel

In Kapitel 2 Verteilte Suche werden grundsätzliche Vorüberlegungen zu Informationssystemen angestellt. Es wird dargelegt, warum die Suche in mehreren Datenbanken bessere Ergebnisse bringt als die Suche in nur einer Datenbank.

In Kapitel 3 Modellierung von ZACK wird anhand des Client-Server-Modells beschrieben, wie die Suche in einer Bibliotheksdatenbank über das Internet erfolgt. Dabei wird kurz erläutert, wie die Kommunikation zwischen Client und Server abläuft und welche unterschiedlichen Protokolle in ZACK verwendet werden. Es wird das Z39.50 Protokoll vorgestellt.

In Kapitel 4 Implementierung von ZACK wird das eigene System vorgestellt. Es wird beschrieben, in welchen Schritten ZACK entworfen und implementiert wurde. Es wird untersucht, welche vorhandene Software für die Entwicklung dieses Systems in Betracht kam und welche in ZACK verwendet wird. Mit dem ersten System kann man nur in einer Datenbank suchen, während man mit dem zweiten System parallel in mehreren Datenbanken suchen kann.

Im zweiten System von ZACK werden bei der Dublettenkontrolle Datensätze unterschiedlicher Herkunft miteinander verglichen. Bevor dies geschehen kann, müssen Zeichensatz, Fehleingaben (z.B. doppelte Leerzeichen), unterschiedliche Erfassungspraktiken erkannt und bearbeitet werden. In Kapitel 5 Normierung werden Datensätze unter diesen Gesichtspunkten analysiert.

In Kapitel 6 Dublettenkontrolle wird beschrieben, wie die Dublettenerkennung in ZACK durchgeführt wird. Es werden die verwendeten Algorithmen, der benötigte Rechenaufwand in ZACK und die Ergebnisse der Dublettenkontrolle erläutert.

Als Ergebnis der Dublettenkontrolle wird dem Benutzer eine Kurztrefferliste ohne doppelte Einträge angeboten. In Kapitel 7 Ausgaben von Dubletten werden die hierbei zur Auswahl stehenden Verfahren beschrieben, bewertet und erläutert, welches Verfahren in ZACK verwendet wird.

Das Kapitel 8 Praktische Ergebnisse einer verteilten Suche beschreibt, wie erfolgreich die verteilte Suche in der Praxis tatsächlich ist. Dazu werden die Anfragen von Bibliothekaren aus Brandenburg ausgewertet, die mit ZACK gesucht haben - einmal die Anfragen eines Tages und einmal über den Zeitraum von mehreren Monaten.

In Kapitel 9 Probleme im laufenden Betrieb werden kleinere und größere Probleme beschrieben, die in der praktischen Nutzung der mit ZACK angesprochenen Z39.50-Server aufgetreten sind. Im Detail werden die Konfigurationsprobleme mit den Z39.50-Servern unterschiedlicher Bibliothekssysteme, unterschiedlicher Hersteller und unterschiedlicher Bibliotheken und Bibliotheksverbünde aufgeführt.

In Kapitel 10 Ausblick wird ein Fazit der Arbeit gezogen und Vorschläge für eine weitere Nutzung des Systems gemacht.

Im Anhang A Analyse der MAB2-Datensätze der Deutschen Bibliothek werden 2,5 Millionen Datensätze der Deutschen Bibliothek statistisch ausgewertet. Ziel ist es festzustellen, welche Felder in den Datensätzen wirklich genutzt werden, wie das Verhältnis zwischen Büchern aus Verlagen und sonstiger Literatur ist und welche Beziehungen (Hierarchien, Verweise) zwischen den Datensätzen existieren. Diese Informationen sind für die Dublettenkontrolle und die Ausgabe der Datensätze erforderlich.

Im Anhang B Z39.50-Server befindet sich eine Liste der genutzen Z39.50 Server; im Anhang C Software eine kurze Beschreibung der für ZACK geschriebenen Software; im Anhang D Zugriffsstatistik eine Auswertung der Nutzung von ZACK im praktischen Betrieb. Zum Anhang gehören außerdem ein Abkürzungsverzeichnis und ein Literaturverzeichnis.

Next: Verteilte Suche Up: Einleitung Previous: Einleitung

Copyright (c) 1999 Wolfram Schneider , 4-July-1999
URL: https://wolfram.schneider.org/lv/diplom/