Data Readiness
Die AI-Tauglichkeit der Unternehmensdaten – verfügbar, vollständig, korrekt und rechtlich nutzbar. Die häufigste Ursache für scheiternde AI-Projekte im Mittelstand.
Definition
Data Readiness ist der Grad, zu dem die Daten eines Unternehmens für AI-Anwendungsfälle verfügbar, zugänglich, vollständig, korrekt und rechtlich nutzbar sind. Sie ist die notwendige Vorbedingung jeder produktiven AI-Lösung.
Fehlende Data Readiness ist der häufigste Grund, warum AI-Projekte im Mittelstand scheitern – nicht die AI-Technologie selbst. Ein perfektes Modell auf unvollständigen, inkonsistenten oder rechtlich nicht nutzbaren Daten liefert keine verwertbaren Ergebnisse.
Die fünf Kriterien der Data Readiness
- Verfügbarkeit: Liegen die benötigten Daten überhaupt vor – in ausreichender Menge und historischer Tiefe?
- Zugänglichkeit: Können die Daten technisch abgerufen werden – aus ERP, CRM, Drittsystemen?
- Vollständigkeit: Wie hoch ist der Anteil fehlender Werte? Sind kritische Felder konsistent befüllt?
- Korrektheit: Entsprechen die Daten der Realität? Gibt es Dubletten, Inkonsistenzen, veraltete Einträge?
- Rechtliche Nutzbarkeit: Liegen DSGVO-konforme Einwilligungen vor? Dürfen die Daten für AI-Modelle genutzt werden?
Wichtig: Data Readiness ist anwendungsfallspezifisch. Für ein Bedarfsprognose-Modell gelten andere Anforderungen als für eine Recommendation Engine oder ein NLP-Klassifikationsmodell. Eine generelle Datenbewertung ohne Use-Case-Bezug ist wenig aussagekräftig.
Abgrenzung
Data Readiness bewertet die Qualität und Nutzbarkeit vorhandener Daten für einen spezifischen AI-Use-Case. Data Architecture beschreibt das strukturelle Modell, wie Daten im Unternehmen fließen – sie ist die Infrastrukturvoraussetzung, Data Readiness die Qualitätsbewertung.
Kurz: Data Architecture regelt den Fluss – Data Readiness bewertet das, was fließt.
Praxisbeispiel
Ein Möbelhändler möchte eine Recommendation Engine einführen. Die Bestellhistorie liegt in drei Systemen vor, Produktdaten sind unvollständig (fehlende Kategorisierungen bei 34 % der SKUs), Kunden-Einwilligungen zur AI-gestützten Personalisierung fehlen vollständig.
Bevor das erste Modell trainiert wird, investiert das Unternehmen sechs Monate in ein Data-Readiness-Programm: Datenmigration, Produktdaten-Bereinigung, Einwilligungsmanagement via CMP und DSGVO-konforme Datenspeicherung. Erst danach startet die Modellentwicklung – mit verlässlicher Grundlage.
FAQ
Wie lange dauert ein Data-Readiness-Programm typischerweise?
Je nach Ausgangszustand zwischen 2 und 12 Monaten. Einfache Bereinigungen und technische Integrationen sind schnell umsetzbar. Rechtliche Nutzbarkeit (Einwilligungen, Datenschutzkonzepte) braucht oft länger als erwartet.
Was ist der Zusammenhang zur DSGVO?
AI-Modelle, die auf personenbezogenen Daten trainiert werden, benötigen eine Rechtsgrundlage nach DSGVO Art. 6 – typischerweise berechtigtes Interesse oder Einwilligung. Ohne rechtlich nutzbare Daten ist Data Readiness unvollständig, unabhängig von der Datenqualität.