next up previous contents
Next: Alle dubletten Datensätze werden Up: No Title Previous: Probleme in der Praxis

Ausgabe von Dubletten

  Bei der Dublettenkontolle werden gleiche bzw. ähnliche Datensätze gefunden. Diese werden in einer geeigneten Art und Weise dem Benutzer präsentiert.

Die Datensätze werden in Kurzdarstellung - einer kurzen, kompakten, leicht verständlichen Form - ausgegeben. In der Kurzdarstellung werden nur wenige Attribute ausgegeben, hier z.B. Autor, Titel, Verlag, Verlagsort und Jahr. Alle anderen Attribute werden ignoriert (z.B. ISBN, Auflage, Seitenzahl, 2. Autor, 3. Autor, Schlagwörter etc.).


Zur Ausgabe der Dubletten gibt es drei Alternativen:

1.
Man gibt alle dubletten Datensätze und die zugehörigen Bibliotheken hintereinander aus.
2.
Man wählt einen Datensatz aus den Dubletten und gibt diesen aus. Zusätzlich wird angegeben, in welchen Bibliotheken der Titel vorhanden ist.

3.
Man fügt die als dublett erkannten Datensätze zu einem neuen Datensatz zusammen und gibt diesen Datensatz aus. Zusätzlich wird angegeben, in welchen Bibliotheken der Titel vorhanden ist.

Grundsätzlich unterscheiden sich dublette Datensätze in der Ausgabe nur minimal voneinander, da sie zuvor anhand einiger wichtiger Attribute [*] als gleich oder sehr ähnlich erkannt worden sind. Wenn die vollständigen Datensätze untereinander sehr ähnlich sind, wird sich auch in der Kurzdarstellung dieser Datensätze kaum etwas ändern. Es geht bei der Ausgabe von Dubletten vor allem darum, die Dubletten dem Benutzer in einer übersichtlichen und verständlichen Form zu präsentieren.

Die zur Verfügung stehenden Alternativen werden nun im einzelnen vorgestellt und bewertet.



 
next up previous contents
Next: Alle dubletten Datensätze werden Up: No Title Previous: Probleme in der Praxis

Copyright (c) 1999 Wolfram Schneider , 4-July-1999
URL: https://wolfram.schneider.org/lv/diplom/