Programm
Mittwoch, 06.02.2008
Mi06.02.19:30
2008 - Jahr der Mathematik
- Prof. Dr. Felix Naumann, Hasso-Plattner-Institut an der Universität Potsdam
Schmutzige Daten und ihre Folgen. Falsche Adressen, doppelte Werbung und neue Technologien
Daten sind sauber, wenn sie ihren Zweck erfüllen, einen Namen oder eine Adresse korrekt angeben. Leider sind sie oft verschmutzt: Hausnummern werden durch Zahlendreher verfälscht, Vornamen und Nachnamen werden vertauscht oder Postleitzahlen passen nicht zum Ortsnamen. Als Folge werden Kunden falsch oder gar doppelt angeschrieben, können Briefe nicht zugestellt werden, werden Kreditlimits mehrfach vergeben. Neue, aufwändige Methoden der Datenreinigung säubern und korrigieren solche verschmutzten Daten. Prof. Naumann wird in seinem Vortrag pfiffige Ideen zum Beispiel zum Aufspüren von Adressen-Dubletten vorstellen.





