next up previous contents
Next: Verwendete Variante Up: Ausgabe von Dubletten Previous: Auswahl eines Datensatzes

Zusammenführen zu einem Datensatz

  Man fügt die dubletten Datensätze zu einem neuen Datensatz zusammen und gibt den neuen Datensatz aus.

Beim Zusammenfügen wird jedes Feld aus dem Datensatz A mit dem betreffenden Feld aus dem Datensatz B verglichen und umgekehrt. Sind die beiden Werte gleich, wird der Wert eines der beiden Datensätze in den neuen Datensatz übernommen. Ist ein Feld nur im Datensatz A vorhanden, aber nicht im Datensatz B, dann wird der Wert aus dem Datensatz A genommen. Gleiches gilt für den umgekehrten Fall - gibt es ein Feld nur im Datensatz B, aber nicht in A, dann wird der Wert von B übernommen. Unterscheiden sich die Werte eines Feldes zwischen den Datensätzen, werden beide Werte in den neuen Datensatz übernommen. [*].


Beispiel:

Simon, Claude: Die Akazie : Roman. Aus dem Franz. von
Eva Moldenhauer. Suhrkamp. Frankfurt am Main, 1991, 1993, 1998. 
Vorhanden in den Bibliotheken: 3 x DDB, 5 x BVB

Dieses Werk erschien 1991 bei Suhrkamp in 3 Auflagen (1., 2., 3. Auflage) mit identischer ISBN-Nummer als gebundenes Buch. 1993 brachte es Suhrkamp noch einmal als Taschenbuch heraus mit einer neuen ISBN-Nummer. Es erschien 1998 wiederum in der 1. Auflage als gebundenes Buch, mit neuer ISBN-Nummer. Die Seitenzahl ist bei jeder Ausgabe gleich, ebenso der Autor, die Übersetzerin, der Verlag und der Verlagsort.


Daten- Jahr Auf- ISBN Seiten- Format
bank   lage   zahl  
DDB 1991 1 3-518-40349-4 354 gebunden
BVB 1991 1 3-518-40349-4 354 gebunden
BVB 1991 2 3-518-40349-4 354 gebunden
BVB 1991 3 3-518-40349-4 354 gebunden
DDB 1993 1 3-518-38732-4 354 Taschenbuch
BVB 1993 1 3-518-38732-4 354 Taschenbuch
DDB 1998 1 3-518-22302-X 354 gebunden
BVB 1998 1 3-518-22302-X 354 gebunden


Tabelle: Inkonsistente Vergabe der ISBN-Nummern


An diesem Beispiel zeigt sich recht deutlich die inkonsistente Vergabe von Auflagen und ISBN-Nummern. Es gibt zweimal eine 1. Auflage für das gebundene Buch, zuerst 1991 und dann nochmal 1998. Warum der Verlag 1998 wieder eine erste Auflage vergibt, ist unklar. Er hätte genauso gut eine 4. Auflage vergeben können. Zum Glück unterscheiden sich die beiden 1. Auflagen in der ISBN-Nummer. Nach dem ISBN-Standard sollen die Verlage für jede Auflage eines Titels eine ISBN-Nummer vergeben ([Ott94]). In diesem Fall hätte für die Auflagen aus dem Jahr 1991 (1., 2., 3.,) jeweils eine neue ISBN-Nummer vergeben werden müssen. Es ist nicht ersichtlich, warum sich die Verlage nicht immer an den ISBN-Standard halten. Offensichtlich wird die ISBN-Nummer häufig nicht geändert, wenn die Auflagen zeitlich kurz aufeinander folgen (ein paar Monate oder innerhalb eines Jahres). [*]

Die Dublettenkontrolle wird durch die inkonsistente Vergabe der ISBN-Nummern deutlich erschwert. Die ISBN-Nummer ist nicht als eindeutige Identifikationsnummer für eine physikalische Ausgabe geeignet.

Dieses Verfahren ist komplizierter als die beiden vorherigen und aufwendiger in der Implementierung. Es wird in Melvil ([Pay96], [Coy91]) eingesetzt.


next up previous contents
Next: Verwendete Variante Up: Ausgabe von Dubletten Previous: Auswahl eines Datensatzes

Copyright (c) 1999 Wolfram Schneider , 4-July-1999
URL: https://wolfram.schneider.org/lv/diplom/