Ausgabe 3 - Magazin - Seite 9
DATA IDENTIFICATION & CLUSTERING
In der täglichen Praxis zeigen sich
bei den meisten Kunden Mängel
in der Datenqualität.
Den Begriff Housekeeping
kennen viele bisher nur aus der
Haushaltsführung. Nun wird er
regelmäßig in der IT genutzt?
Was bedeutet das eigentlich?
Housekeeping steht, wie im Leben, auch in der
IT dafür, „sein Haus in Ordnung zu halten“. Im
Grunde stecken da zwei Themenbereiche drin.
Sie umfassen im Wesentlichen die Datenqualität
und das Datenvolumen. Das Erste, was einem
bei Datenqualität einfällt, sind Dubletten oder
Inkonsistenzen in Stammdaten. Ein Dauerthema! Die Reduzierung von Datenmengen
ist darüber hinaus besonders interessant als
Vorbereitung für eine Migration. Es ist wie
beim Umzug in ein neues Haus oder eine neue
Wohnung. Da nutzt man ja auch die Gunst der
Stunde, um zu entrümpeln. Was brauche ich
nicht mehr? Was kann weg? Vor einer Migration
ist es dasselbe. Ich nehme nur mit, was ich
aktuell brauche. Inaktive Buchungskreise oder
uralte historische Daten bleiben im alten System,
gehen ins Archiv oder werden gelöscht.
Und warum will man Datenmengen verringern? Hat das
Performance-Gründe oder
eher Kostengründe?
Je weniger Dubletten, desto schneller ist die
Suchanfrage. Und wenn du ganze Buchungskreise rausnimmst oder alte Datensätze
archivierst, werden nicht nur Datenabfragen
schneller, du hast auch konkrete Kostenvorteile.
Speicher ist unter SAP HANA sauteuer.
Man sollte glauben, dass die
Datenbestände der Unternehmen
immer aufgeräumt sind?
Es gibt aus meiner Erfahrung zwei Arten von
Kunden. Die einen sind sich sicher, dass ihr
System perfekt aufgeräumt ist. Sie erklären uns,
dass sie sich die Systeme regelmäßig ansehen
und keine Inkonsistenzen oder Dubletten
finden. Das macht uns die Arbeit natürlich
leichter. Es gibt aber auch Kunden, die ganz
ehrlich offenlegen, dass sie die Pflege in den
letzten Jahren etwas vernachlässigt haben und
ihnen bewusst ist, dass sie da ranmüssen.
Diese Kunden nutzen die Transformation für
einen Großputz in ihren Systemen. In der
täglichen Praxis zeigt sich dennoch, dass bei
allen Kunden Mängel in der Datenqualität
gefunden werden. Da haben wir schon so
manchen Kunden sehr erstaunt. Deswegen
landen wir bei beiden Kundengruppen oft am
selben Punkt: Erst mal aufräumen und dann
migrieren.
Beides. Beide Initiativen im Housekeeping
zahlen auf die Performance ein. Je weniger
Dubletten, desto geringer der Datenbestand.
Das wird schon bei Suchanfragen spürbar.
9