Dublettenerkennung - Aufwand Aufwand: n*(n-1)/2 10 Datensaetze -> 45 Vergleiche 30 Datensaetze -> 435 Vergleiche Performance Optimierung mit temporaerem Index Cluster von aehnlichen Datensaetzen Grenzen wieviel Toleranz erlaubt