Die Datensätze werden in Kurzdarstellung - einer kurzen, kompakten, leicht verständlichen Form - ausgegeben. In der Kurzdarstellung werden nur wenige Attribute ausgegeben, hier z.B. Autor, Titel, Verlag, Verlagsort und Jahr. Alle anderen Attribute werden ignoriert (z.B. ISBN, Auflage, Seitenzahl, 2. Autor, 3. Autor, Schlagwörter etc.).
Zur Ausgabe der Dubletten gibt es drei Alternativen:
Grundsätzlich unterscheiden
sich dublette Datensätze in der
Ausgabe nur minimal voneinander, da sie zuvor anhand einiger wichtiger
Attribute
als gleich oder sehr ähnlich erkannt
worden sind.
Wenn die vollständigen Datensätze untereinander sehr ähnlich sind,
wird sich auch in der Kurzdarstellung dieser Datensätze kaum
etwas ändern.
Es geht bei der
Ausgabe von Dubletten vor allem darum, die Dubletten dem Benutzer in einer
übersichtlichen und verständlichen Form zu präsentieren.
Die zur Verfügung stehenden Alternativen werden nun im einzelnen vorgestellt und bewertet.