«Garbage in - Garbage out» - Zeit, Ihre Daten auf Vordermann zu bringen!

Ist Ihnen die Bezeichnung «Garbage in - Garbage out» bekannt? Werden Daten fehlerhaft oder unvollständig erfasst, so werden diese Fehler in die Berechnungen oder in das Reporting weitergetragen. Folglich fallen dann auch diese falsch bzw. unvollständig aus. Im Falle von Fehlern in den Transformations- oder Berechnungsregeln würde die Produktion auch bei korrekter Dateneingabe stets nur falsche Ergebnisse liefern. Bei diesen beiden Arten von Fehlern stellt sich die Frage: Wie wird Datenqualität definiert? Wie kann die Datenqualität verbessert und sogar quantifiziert werden? Was zeichnet denn eigentlich gute oder schlechte Datenqualität aus? Bei welchen Systemanwendungen ist es sinnvoll, die Datenqualität zu messen und was sollte bei einer solchen Messung vermieden werden? Diese Fragen und weitere werden im Folgenden beantwortet.

Was ist unter Datenqualität zu verstehen?

Um die Datenqualität einschätzen zu können, wird eine Bewertung der erfassten und verarbeiteten Daten (dazu gehören Dateien, Tabellen, Felder, Transformationen, Stapel usw.) hinsichtlich dessen, ob sie ihren spezifischen Zweck erfüllen und für die vorgesehene Verwendung geeignet sind, vorgenommen.

Das Datenqualitätsmanagement eines Unternehmens sollte sich aus verschiedenen Elementen zusammensetzen. Als Grundlage sollte ein globales regulatorisches Framework geschaffen werden, welches die Methoden zur Messung der Datenqualität, die zu messenden Datenpunkte und die Kontrollen zur Verwaltung der Datenqualität sowie die Methoden zur Korrektur von Datenqualitätsproblemen und schliesslich den Ansatz zur Berichterstattung über die Datenqualität umfasst. Bei der Sicherstellung der Datenqualität in einer Umgebung mit komplexen IT-Systemen ist es wichtig, einen ganzheitlichen Ansatz zu verfolgen. Das bedeutet, dass die Datenqualität nicht nur innerhalb einzelner Systeme gemessen wird, sondern auch zwischen verschiedenen Systemen und dies mittels der konsistenten und standardisierten Verwendung von Messmethoden und Kategorien. Die vier Hauptkomponenten, mit denen ein Unternehmen beim Umgang mit Datenqualität konfrontiert wird, sind: Messung, Tracking, Korrektur und Reporting. Für weitere Einzelheiten zu den einzelnen Komponenten klicken Sie bitte auf den entsprechenden Button.

 

Fazit

Das Wissen, die Dokumentation, die klare Verantwortlichkeit und das aktive Management von Datenquellen, -transformationen und -ergebnissen ist eine Grundvoraussetzung für ein Unternehmen, um nachhaltige Datenqualität zu erreichen. Nicht nur Dateneingabesysteme, sondern auch die technische Datenbasis, E(xtract)T(ransform)L(oad)-Prozesse und Business Intelligence Tools sollten bei der Messung der Datenqualität berücksichtigt werden. In Anbetracht der Gültigkeit der Bezeichnung «Garbage in - Garbage out» ist eine korrekte Datenerfassung notwendig, um korrekte und zuverlässige Auswertungen zur optimalen Steuerung und Kontrolle eines Unternehmens zu erhalten. Andernfalls ist es naheliegend, dass Geschäftsentscheidungen auf fehlerhaften Daten beruhen. Bei der Implementierung von Algorithmen des maschinellen Lernens oder anderen Algorithmen der künstlichen Intelligenz liegt in schlechter Datenqualität sowohl die grösste Herausforderung und als auch die grösste Zeitverschwendung. Daher ist es jetzt an der Zeit, Ihre Daten auf Vordermann zu bringen und Ihre Datenqualität zu standardisieren.

Ein geeigneter Ausgangspunkt ist eine Bewertung des Status quo der Datenqualität und des Verbesserungspotenzials, die Einrichtung eines Frameworks zur Datenqualität oder die Festlegung eines Datenqualitätsberichts.

29.09.2022