Data Readiness – Definition, Kriterien & Praxisbeispiel

Definition

Data Readiness ist der Grad, zu dem die Daten eines Unternehmens für AI-Anwendungsfälle verfügbar, zugänglich, vollständig, korrekt und rechtlich nutzbar sind. Sie ist die notwendige Vorbedingung jeder produktiven AI-Lösung.

Fehlende Data Readiness ist der häufigste Grund, warum AI-Projekte im Mittelstand scheitern – nicht die AI-Technologie selbst. Ein perfektes Modell auf unvollständigen, inkonsistenten oder rechtlich nicht nutzbaren Daten liefert keine verwertbaren Ergebnisse.

Die fünf Kriterien der Data Readiness

Verfügbarkeit: Liegen die benötigten Daten überhaupt vor – in ausreichender Menge und historischer Tiefe?
Zugänglichkeit: Können die Daten technisch abgerufen werden – aus ERP, CRM, Drittsystemen?
Vollständigkeit: Wie hoch ist der Anteil fehlender Werte? Sind kritische Felder konsistent befüllt?
Korrektheit: Entsprechen die Daten der Realität? Gibt es Dubletten, Inkonsistenzen, veraltete Einträge?
Rechtliche Nutzbarkeit: Liegen DSGVO-konforme Einwilligungen vor? Dürfen die Daten für AI-Modelle genutzt werden?

Wichtig: Data Readiness ist anwendungsfallspezifisch. Für ein Bedarfsprognose-Modell gelten andere Anforderungen als für eine Recommendation Engine oder ein NLP-Klassifikationsmodell. Eine generelle Datenbewertung ohne Use-Case-Bezug ist wenig aussagekräftig.

Abgrenzung

Data Readiness bewertet die Qualität und Nutzbarkeit vorhandener Daten für einen spezifischen AI-Use-Case. Data Architecture beschreibt das strukturelle Modell, wie Daten im Unternehmen fließen – sie ist die Infrastrukturvoraussetzung, Data Readiness die Qualitätsbewertung.

Kurz: Data Architecture regelt den Fluss – Data Readiness bewertet das, was fließt.

Praxisbeispiel

Anwendungsbeispiel aus der Praxis

Ein Möbelhändler möchte eine Recommendation Engine einführen. Die Bestellhistorie liegt in drei Systemen vor, Produktdaten sind unvollständig (fehlende Kategorisierungen bei 34 % der SKUs), Kunden-Einwilligungen zur AI-gestützten Personalisierung fehlen vollständig.

Bevor das erste Modell trainiert wird, investiert das Unternehmen sechs Monate in ein Data-Readiness-Programm: Datenmigration, Produktdaten-Bereinigung, Einwilligungsmanagement via CMP und DSGVO-konforme Datenspeicherung. Erst danach startet die Modellentwicklung – mit verlässlicher Grundlage.

FAQ

Wie lange dauert ein Data-Readiness-Programm typischerweise?

Je nach Ausgangszustand zwischen 2 und 12 Monaten. Einfache Bereinigungen und technische Integrationen sind schnell umsetzbar. Rechtliche Nutzbarkeit (Einwilligungen, Datenschutzkonzepte) braucht oft länger als erwartet.

Was ist der Zusammenhang zur DSGVO?

AI-Modelle, die auf personenbezogenen Daten trainiert werden, benötigen eine Rechtsgrundlage nach DSGVO Art. 6 – typischerweise berechtigtes Interesse oder Einwilligung. Ohne rechtlich nutzbare Daten ist Data Readiness unvollständig, unabhängig von der Datenqualität.

Semantische Beziehungen

Aufwärts (Pillar)

↑ AI Readiness

Basiert auf

Data Architecture →

Verwandte Begriffe

AI Prototyping → AI Skalierung →

Alle Begriffe

→ Glossar-Index