next up previous contents
Next: Verlag Up: Attributspezifische Normierung in ZACK Previous: Seitenzahl

Verlagsort

Verwendete Normierungsfunktionen:

1.
Groß-und Kleinschreibung
2.
Eckige Klammern
3.
Umlaute konvertieren
4.
Trunkieren nach Zeichen - alles ab dem ersten Komma, Semikolon oder Schrägstrich ignorieren
5.
Sonderzeichen löschen
6.
Trunkieren nach Länge - nur die ersten 5 Zeichen
7.
Überflüssige Leerzeichen löschen


vorher nachher
``Ötztal'' ``oetzt''
``Reinbek bei Hamburg'' ``reinb''
``Hamburg ; München'' ``hambu''
``München; Hamburg'' ``muenc''
``Halle (Saale)'' ``halle''
``Bern ; Stuttgart'' ``bern''
``Freiburg [Breisgau]'' ``freib''
``Karl-Marx-Stadt'' ``karl''
``Bonn ; Albany ¬[u.a.]¬ ``bonn''


Tabelle: ZACK : Normierung Attribut Verlagsort


Alternativ: am besten wäre es wahrscheinlich, einzelne Wörter zu extrahieren und mit logischen ODER zu verbinden. Zum Beispiel: Berlin oder Muenchen. Dies ist aber wesentlich aufwendiger.


Copyright (c) 1999 Wolfram Schneider , 4-July-1999
URL: https://wolfram.schneider.org/lv/diplom/