vorher | nachher |
``2. ed., [Nachdr.]'' | ``2. ed., '' |
``[Briefmarkenfreunde Perl]'' | ``'' |
``Cambridge [u.a.]'' | ``Cambridge '' |
Tabelle: Normierungsfunktion: Eckige Klammern
Alle Zeichen zwischen den Nicht-Sortierzeichen (``¬'') und die Nicht-Sortierzeichen selbst werden gelöscht. Zwischen dem Nicht-Sortierzeichen stehen Wörter, die bei der Sortierung im Register nicht beachtet werden sollen. Dazu gehörten meistens die Artikel ``der'', ``die'', ``das'' und `` the''. Der Artikel eines Titels hat eine geringe inhaltliche Bedeutung. Alternativ: nur die Nicht-Sortierzeichen werden gelöscht (siehe Normierungsfunktion Sonderzeichen löschen).
vorher | nachher |
``¬Die¬ Spatzen im Birnbaum'' | `` Spatzen im Birnbaum'' |
``Wildsmith, Brian ¬[Ill.]¬'' | ``Wildsmith, Brian '' |
``¬M.¬ Groß'' | `` Groß'' |
``¬Der¬ Steppenwolf'' | ``Steppenwolf'' |
``Der Steppenwolf'' | ``Der Steppenwolf'' |
``Steppenwolf'' | ``Steppenwolf'' |
Tabelle: Normierungsfunktion: Nicht-Sortierzeichen
Anhand des realen Beispieles Steppenwolf aus der DDB ist schwer zu entscheiden, welche der beiden Varianten besser ist. Es kommt in der Praxis doch recht häufig vor, daß die Nicht-Sortierzeichen bei der Erfassung vergessen werden.
Alle Zeichen werden klein geschrieben. Alternativ: alle Kleinbuchstaben werden in Großbuchstaben umgewandelt. Die Groß- und Kleinschreibung hat inhaltlich praktisch keine Bedeutung. Sie wird bei fast allen Bibliotheksdatenbanken ignoriert.
vorher | nachher |
``Schatten im Paradies'' | ``schatten im paradies'' |
``Wall, Larry'' | ``wall, larry'' |
``HyperWave'' | ``hyperwave'' |
Tabelle: Normierungsfunktion: Groß-und Kleinschreibung
Umlaute (8 Bit) werden durch Buchstaben (7 Bit, ASCII) ersetzt (``ä'' ``ae''). Dadurch wird die Anzahl der Zeichen weiter reduziert und unterschiedliche Schreibweisen ein und desselben Autors erkannt.
vorher | nachher |
``Lügger, Joachim'' | ``Luegger, Joachim'' |
``Große Brandenburger Ausgabe'' | ``Grosse Brandenburger Ausgabe'' |
``Großraum-Städteatlas Saarland'' | ``Grossraum-Staedteatlas Saarland'' |
Tabelle: Normierungsfunktion: Umlaute konvertieren
Alle Sonderzeichen (Nicht-Buchstaben oder Nicht-Ziffern) werden gelöscht bzw. durch ein Leerzeichen ersetzt. Die Anzahl der Zeichen wird drastisch reduziert.
vorher | nachher |
``1. Aufl., 1. - 230. Tsd.'' | ``1 Aufl 1 230 Tsd '' |
``Schwarzkopf & Schwarzkopf'' | ``Schwarzkopf Schwarzkopf'' |
``Hukkanen, Marja-Leena'' | ``Hukkanen Marja Leena'' |
``1. Aufl., [dt. Ausg. der 2. [Orig.]- | ``1 Aufl dt Ausg der 2 Orig |
Aufl., neue Aufl., neue Übers.]'' | Aufl neue Aufl neue Übers '' |
Tabelle: Normierungsfunktion: Sonderzeichen löschen
Leerzeichen am Anfang, Leerzeichen am Ende und doppelte Leerzeichen in der Zeichenfolge werden gelöscht. Diese Leerzeichen haben keinerlei inhaltliche Bedeutung.
vorher | nachher |
``1 Bl. '' | ``1 Bl.'' |
`` Spatzen im Birnbaum'' | ``Spatzen im Birnbaum'' |
Tabelle: Normierungsfunktion: Bestimmte Leerzeichen löschen
Sämtliche Leerzeichen in der Zeichenfolge werden gelöscht. Die Leerzeichen trennen Wörter und erleichtern den Lesefluß. Zur Erkennung von unterschiedlichen Schreibweisen sind sie eher hinderlich.
vorher | nachher |
``informations system'' | ``informationssystem'' |
``Dalitz, Wolfgang'' | ``Dalitz,Wolfgang'' |
``dalitz w'' | ``dalitzw'' |
``Akazienblüthen aus der Schweiz'' | ``AkazienblüthenausderSchweiz'' |
``Frankfurt am Main'' | ``FrankfurtamMain'' |
Tabelle: Normierungsfunktion: Alle Leerzeichen löschen
Die Abkürzung ``u.a.'' (und andere) wird gelöscht. Diese Abkürzung ist nicht wichtig für die Dublettenkontrolle. Sie wird von Bibliothekaren benutzt, wenn sie nicht alle Verlagsorte aufnehmen.
vorher | nachher |
``Berlin u.a.'' | ``Berlin '' |
``Stuttgart [u.a.]'' | ``Stuttgart []'' |
Tabelle: Normierungsfunktion: Abkürzung ``u.a.'' löschen
Häufig auftretende Abkürzungen wie ``Aufl.'', ``Verl.'' etc. werden ausgeschrieben, und der Punkt am Ende der Abkürzung wird gelöscht. Diese Funktion ist sehr aufwendig und benötigt viel Rechenzeit. Für jede Sprache (deutsch, englisch, französisch etc.) müssen die gängigen Abkürzungen festgelegt werden.
vorher | nachher |
``Greifenverl.'' | ``Greifenverlag'' |
``Ungekürzte Ausg.'' | ``Ungekürzte Ausgabe'' |
``Aufl.'' | ``Auflage'' |
``Freie Univ., | ``Freie Universität, |
Fachbereich Mathematik'' | Fachbereich Mathematik'' |
``Aufbau-Verl.'' | ``Aufbau-Verlag'' |
``Dt. Ärzte-Verl.'' | ``Deutscher Ärzte-Verlag'' |
Tabelle: Normierungsfunktion: Abkürzungen ausschreiben
Es wird nur der Anfang der Zeichenfolge verwendet. Der Rest wird abgeschnitten. Dadurch können auf einfache Art viele Schreibvarianten auf eine Form reduziert werden.
Nach 5 Zeichen abschneiden:
vorher | nachher |
``Frankfurt am Main'' | ``Frank'' |
``Görlitz'' | ``Görli'' |
``Bonn'' | ``Bonn'' |
Tabelle: Normierungsfunktion: Trunkieren nach Länge, 5 Zeichen
Tritt ein bestimmtes Zeichen (Schrägstrich, Semikolon, Komma) auf, wird dieses Zeichen und alle nachfolgenden ignoriert. Das Semikolon trennt z.B. die Verlagsorte voneinander.
vorher | nachher |
``Berlin ; Weimar'' | ``Berlin '' |
``Cambridge ; Köln [u.a.]'' | ``Cambridge'' |
Tabelle: Normierungsfunktion: Trunkieren nach definierten Trennzeichen
Es wird nach einer (arabischen) Zahl in der Zeichenfolge gesucht und die erste gefundene verwendet. Alternativ: sind mehrere Zahlen in der Zeichenfolge vorhanden, so wird die größte genommen. Diese Funktion wird für die Attribute Jahr, Seitenzahl und Auflage benötigt, in denen nur Zahlen ausgewertet werden.
vorher | nachher |
``1. Aufl.'' | ``1'' |
``1. Aufl., 1. - 230. Tsd.'' | ``1'' |
``21.-30. Tsd.'' | ``21'' |
``1990'' | ``1990'' |
``1911 - 1916'' | ``1911'' |
Tabelle: Normierungsfunktion: Zahlen suchen, erste Zahl
vorher | nachher |
``1. Aufl.'' | ``1'' |
``1. Aufl., 1. - 230. Tsd.'' | ``230'' |
``21.-30. Tsd.'' | ``30'' |
``1990'' | ``1990'' |
``1911 - 1916'' | ``1916'' |
Tabelle: Normierungsfunktion: Zahlen suchen, größte Zahl
Die größte Zahl zu finden, ist komplexer und rechenintensiver als die erste Zahl zu finden.