next up previous contents
Next: Spezialfälle Up: Normierungsfunktionen Previous: Normierungsfunktionen

Allgemeine Normierungsfunktionen

 
Eckige Klammern Alle Zeichen zwischen eckigen Klammern (``['', ``]'') und die eckigen Klammern selbst werden gelöscht. Zwischen eckigen Klammern stehen häufig Anmerkungen und Ergänzungen der Katalogisierer, die nicht in der Vorlage enthalten sind. Da diese Anmerkungen Interpretationsspielräume zulassen, sind sie für die Dublettenkontrolle in verteilten Systemen nur bedingt geeignet.


vorher nachher
``2. ed., [Nachdr.]'' ``2. ed., ''
``[Briefmarkenfreunde Perl]'' ``''
``Cambridge [u.a.]'' ``Cambridge ''


Tabelle: Normierungsfunktion: Eckige Klammern

Nicht-Sortierzeichen

Alle Zeichen zwischen den Nicht-Sortierzeichen (``¬'') und die Nicht-Sortierzeichen selbst werden gelöscht. Zwischen dem Nicht-Sortierzeichen stehen Wörter, die bei der Sortierung im Register nicht beachtet werden sollen. Dazu gehörten meistens die Artikel ``der'', ``die'', ``das'' und `` the''. Der Artikel eines Titels hat eine geringe inhaltliche Bedeutung. Alternativ: nur die Nicht-Sortierzeichen werden gelöscht (siehe Normierungsfunktion Sonderzeichen löschen).


vorher nachher
``¬Die¬ Spatzen im Birnbaum'' `` Spatzen im Birnbaum''
``Wildsmith, Brian ¬[Ill.]¬'' ``Wildsmith, Brian ''
``¬M.¬ Groß'' `` Groß''
``¬Der¬ Steppenwolf'' ``Steppenwolf''
``Der Steppenwolf'' ``Der Steppenwolf''
``Steppenwolf'' ``Steppenwolf''


Tabelle: Normierungsfunktion: Nicht-Sortierzeichen

Anhand des realen Beispieles Steppenwolf aus der DDB ist schwer zu entscheiden, welche der beiden Varianten besser ist. Es kommt in der Praxis doch recht häufig vor, daß die Nicht-Sortierzeichen bei der Erfassung vergessen werden.

Groß-und Kleinschreibung

Alle Zeichen werden klein geschrieben. Alternativ: alle Kleinbuchstaben werden in Großbuchstaben umgewandelt. Die Groß- und Kleinschreibung hat inhaltlich praktisch keine Bedeutung. Sie wird bei fast allen Bibliotheksdatenbanken ignoriert.


vorher nachher
``Schatten im Paradies'' ``schatten im paradies''
``Wall, Larry'' ``wall, larry''
``HyperWave'' ``hyperwave''


Tabelle: Normierungsfunktion: Groß-und Kleinschreibung

Umlaute konvertieren

Umlaute (8 Bit) werden durch Buchstaben (7 Bit, ASCII) ersetzt (``ä'' $\Rightarrow$ ``ae''). Dadurch wird die Anzahl der Zeichen weiter reduziert und unterschiedliche Schreibweisen ein und desselben Autors erkannt.


vorher nachher
``Lügger, Joachim'' ``Luegger, Joachim''
``Große Brandenburger Ausgabe'' ``Grosse Brandenburger Ausgabe''
``Großraum-Städteatlas Saarland'' ``Grossraum-Staedteatlas Saarland''


Tabelle: Normierungsfunktion: Umlaute konvertieren

Sonderzeichen löschen

Alle Sonderzeichen (Nicht-Buchstaben oder Nicht-Ziffern) werden gelöscht bzw. durch ein Leerzeichen ersetzt. Die Anzahl der Zeichen wird drastisch reduziert.


vorher nachher
``1. Aufl., 1. - 230. Tsd.'' ``1 Aufl 1 230 Tsd ''
``Schwarzkopf & Schwarzkopf'' ``Schwarzkopf Schwarzkopf''
``Hukkanen, Marja-Leena'' ``Hukkanen Marja Leena''
``1. Aufl., [dt. Ausg. der 2. [Orig.]- ``1 Aufl dt Ausg der 2 Orig
Aufl., neue Aufl., neue Übers.]'' Aufl neue Aufl neue Übers ''


Tabelle: Normierungsfunktion: Sonderzeichen löschen

Bestimmte Leerzeichen löschen

Leerzeichen am Anfang, Leerzeichen am Ende und doppelte Leerzeichen in der Zeichenfolge werden gelöscht. Diese Leerzeichen haben keinerlei inhaltliche Bedeutung.


vorher nachher
``1 Bl. '' ``1 Bl.''
`` Spatzen im Birnbaum'' ``Spatzen im Birnbaum''


Tabelle: Normierungsfunktion: Bestimmte Leerzeichen löschen

Alle Leerzeichen löschen

Sämtliche Leerzeichen in der Zeichenfolge werden gelöscht. Die Leerzeichen trennen Wörter und erleichtern den Lesefluß. Zur Erkennung von unterschiedlichen Schreibweisen sind sie eher hinderlich.


vorher nachher
``informations system'' ``informationssystem''
``Dalitz, Wolfgang'' ``Dalitz,Wolfgang''
``dalitz w'' ``dalitzw''
``Akazienblüthen aus der Schweiz'' ``AkazienblüthenausderSchweiz''
``Frankfurt am Main'' ``FrankfurtamMain''


Tabelle: Normierungsfunktion: Alle Leerzeichen löschen

Abkürzungen löschen

Die Abkürzung ``u.a.'' (und andere) wird gelöscht. Diese Abkürzung ist nicht wichtig für die Dublettenkontrolle. Sie wird von Bibliothekaren benutzt, wenn sie nicht alle Verlagsorte aufnehmen.


vorher nachher
``Berlin u.a.'' ``Berlin ''
``Stuttgart [u.a.]'' ``Stuttgart []''


Tabelle: Normierungsfunktion: Abkürzung ``u.a.'' löschen

Abkürzungen ausschreiben

Häufig auftretende Abkürzungen wie ``Aufl.'', ``Verl.'' etc. werden ausgeschrieben, und der Punkt am Ende der Abkürzung wird gelöscht. Diese Funktion ist sehr aufwendig und benötigt viel Rechenzeit. Für jede Sprache (deutsch, englisch, französisch etc.) müssen die gängigen Abkürzungen festgelegt werden.


vorher nachher
``Greifenverl.'' ``Greifenverlag''
``Ungekürzte Ausg.'' ``Ungekürzte Ausgabe''
``Aufl.'' ``Auflage''
``Freie Univ., ``Freie Universität,
Fachbereich Mathematik'' Fachbereich Mathematik''
``Aufbau-Verl.'' ``Aufbau-Verlag''
``Dt. Ärzte-Verl.'' ``Deutscher Ärzte-Verlag''


Tabelle: Normierungsfunktion: Abkürzungen ausschreiben

Trunkieren nach Länge

Es wird nur der Anfang der Zeichenfolge verwendet. Der Rest wird abgeschnitten. Dadurch können auf einfache Art viele Schreibvarianten auf eine Form reduziert werden.

Nach 5 Zeichen abschneiden:


vorher nachher
``Frankfurt am Main'' ``Frank''
``Görlitz'' ``Görli''
``Bonn'' ``Bonn''


Tabelle: Normierungsfunktion: Trunkieren nach Länge, 5 Zeichen

Trunkieren nach definierten Trennzeichen

Tritt ein bestimmtes Zeichen (Schrägstrich, Semikolon, Komma) auf, wird dieses Zeichen und alle nachfolgenden ignoriert. Das Semikolon trennt z.B. die Verlagsorte voneinander.


vorher nachher
``Berlin ; Weimar'' ``Berlin ''
``Cambridge ; Köln [u.a.]'' ``Cambridge''


Tabelle: Normierungsfunktion: Trunkieren nach definierten Trennzeichen

Zahlen suchen

Es wird nach einer (arabischen) Zahl in der Zeichenfolge gesucht und die erste gefundene verwendet. Alternativ: sind mehrere Zahlen in der Zeichenfolge vorhanden, so wird die größte genommen. Diese Funktion wird für die Attribute Jahr, Seitenzahl und Auflage benötigt, in denen nur Zahlen ausgewertet werden.


vorher nachher
``1. Aufl.'' ``1''
``1. Aufl., 1. - 230. Tsd.'' ``1''
``21.-30. Tsd.'' ``21''
``1990'' ``1990''
``1911 - 1916'' ``1911''


Tabelle: Normierungsfunktion: Zahlen suchen, erste Zahl


vorher nachher
``1. Aufl.'' ``1''
``1. Aufl., 1. - 230. Tsd.'' ``230''
``21.-30. Tsd.'' ``30''
``1990'' ``1990''
``1911 - 1916'' ``1916''


Tabelle: Normierungsfunktion: Zahlen suchen, größte Zahl


Die größte Zahl zu finden, ist komplexer und rechenintensiver als die erste Zahl zu finden.


next up previous contents
Next: Spezialfälle Up: Normierungsfunktionen Previous: Normierungsfunktionen

Copyright (c) 1999 Wolfram Schneider , 4-July-1999
URL: https://wolfram.schneider.org/lv/diplom/