next up previous contents
Next: Übersetzungen Up: Test der Normierung der Previous: Frankfurt an der Oder

Frankfurt am Main

Straßennamen wie z.B. ``Frankfurt a.M., Wiener Str. 61'' werden in dieser Auswertung ignoriert und als ``Frankfurt a.M.'' gewertet. Stadtteile wie z.B. ``Frankfurt/Rödelheim'' oder ``Frankfurt/Sulzbach'' sind ebenfalls nicht aufgeführt. Fehlende Klammern werden nicht gewertet: ``Frankfurt (Main])'' $\Rightarrow$ ``Frankfurt (Main)''. Leerzeichen am Anfang oder Ende der Zeichenfolge werden ignoriert.

Frankfurt              Frankfurt [am Main]    Frankfurt/ M
Frankfurt (M)          Frankfurt a Main       Frankfurt/M
Frankfurt (M.)         Frankfurt a. M.        Frankfurt/M.
Frankfurt (Main)       Frankfurt a. Main      Frankfurt/M[ain]
Frankfurt ([Main)]     Frankfurt a./M.        Frankfurt/Main
Frankfurt ([Main])     Frankfurt a.M          Frankfurt/Main.
Frankfurt (a.M.)       Frankfurt a.M.         Frankfurt/Meno
Frankfurt (am Main)    Frankfurt am M.        Frankfurt/a.M.
Frankfurt (main)       Frankfurt am Main      Frankfurt/m
Frankfurt / M.         Frankfurt am Mainn     Frankfurt/m.
Frankfurt / Main       Frankfurt am Man       Frankfurt[/M.]
Frankfurt /M.          Frankfurt am main      Frankfurt[/Main]
Frankfurt /Main        Frankfurt na Majn      Frankfurtam Main
Frankfurt M            Frankfurt na Majne
Frankfurt M.           Frankfurt nad Menem
Frankfurt Main         Frankfurt on Main
Frankfurt [(am Main)]  Frankfurt on the Main
Frankfurt [/Main]      Frankfurt(M)
Frankfurt [a.M.]       Frankfurt(Main)

Anmerkung: in einigen Fällen wurde ``Frankfurt am Main'' bzw. nur der Zusatz ``am Main'' übersetzt.

Frankfurt na Majn
Frankfurt na Majne
Frankfurt nad Menem
Frankfurt on Main
Frankfurt on the Main

Die Anzahl der unterschiedlichen Schreibweisen kann deutlich durch die folgenden Schritte reduziert werden:

1.
Ersetzen der Zeichen Klammer auf, Klammer zu, Punkt, Schrägstrich durch Leerzeichen, danach Ersetzen von mehreren aufeinanderfolgenden Leerzeichen durch ein einzelnes Leerzeichen. Löschen von Leerzeichen am Anfang und am Ende.

Beispiel 1) ``Frankfurt / Main.'' wird zu ``Frankfurt Main '' und dann zu ``Frankfurt Main''

Beispiel 2) ``Frankfurt/Main'' wird zu ``Frankfurt Main''

2.
Kleinschreibung. ``Frankfurt M'' wird zu ``frankfurt m''

frankfurt             frankfurt main
frankfurt a m         frankfurt meno
frankfurt a main      frankfurt na majn
frankfurt am m        frankfurt na majne
frankfurt am main     frankfurt nad menem
frankfurt am mainn    frankfurt on main
frankfurt am man      frankfurt on the main
frankfurt m           frankfurtam main
frankfurt m ain

Es verbleiben 17 unterschiedliche Schreibweisen. Ein weiterer Normierungschritt ist das Löschen sämtlicher Leerzeichen. Beispiel:


vorher nachher
``frankfurt a m'' ``frankfurtam''
``frankfurt m'' ``frankfurtm''
``frankfurt main'' ``frankfurtmain''


Tabelle: Normierung von Frankfurt, ohne Leerzeichen


Dadurch reduziert sich die Anzahl der unterschiedliche Schreibweisen auf 15.

frankfurt          frankfurtmain
frankfurtam        frankfurtmeno
frankfurtamain     frankfurtnadmenem
frankfurtamm       frankfurtnamajn
frankfurtammain    frankfurtnamajne
frankfurtammainn   frankfurtonmain
frankfurtamman     frankfurtonthemain
frankfurtm

Beschränkt man den Vergleich auf die ersten 5 Buchstaben, so bleibt nur noch eine Schreibweise übrig:


vorher nachher
``frankfurt'' ``frank''
``frankfurtammain'' ``frank''


Tabelle: Normierung von Frankfurt, nur die ersten 5 Buchstaben


Anmerkung: für diesen Test wurde nach Datensätzen gesucht, die das Wort ``Frankfurt'' (Groß-und Kleinschreibung wird ignoriert) im Feld Verlagsort haben. Tippfehler, Abkürzungen oder Übersetzungen wurden deshalb nicht erfaßt. Beispiele aus den Daten der Deutschen Bibliothek sind:



 
next up previous contents
Next: Übersetzungen Up: Test der Normierung der Previous: Frankfurt an der Oder

Copyright (c) 1999 Wolfram Schneider , 4-July-1999
URL: https://wolfram.schneider.org/lv/diplom/