3 Schichten machen aus Daten Wissen

Im letzten Essay ging es um Ontologie. Um die Idee, dass Daten erst nützlich werden, wenn man die Beziehungen dazwischen aufbaut. Wie das konkret aussieht, möchte ich hier beschreiben.

In den Projekten, die ich in dreissig Jahren gesehen habe, gab es fast immer ein Dashboard. Oft mehrere. Die Dashboards sahen gut aus und aktualisierten sich. Kurven, Zahlen, alles da. Aber wenn ich nachgefragt habe, woher eine bestimmte Zahl kommt und wie verlässlich sie ist, ging die Suche los. Die Daten kamen aus verschiedenen Quellen, waren unterschiedlich formatiert, teilweise veraltet, teilweise widersprüchlich.

Man hatte die Darstellung gebaut bevor die Grundlage stand. Ich nenne es das Tool-First-Problem.

Was stattdessen nötig ist, sind drei Schichten.

Drei Schichten: Fakten, Interpretation, Darstellung

Erste Schicht: Fakten

Die unterste Schicht enthält strukturierte Fakten. Jede Aussage hat eine Herkunft und eine Qualitätsbewertung. Und sie ist mit anderen Aussagen verbunden. Hier steht, was wir wissen und wie sicher wir es wissen.

Die Medizin hat das vor dreissig Jahren gelöst. Das GRADE-System (Guyatt et al., 2008, BMJ) bewertet jede klinische Empfehlung auf einer Skala von “sehr niedrig” bis “hoch.” Man kann nachvollziehen, warum eine Empfehlung als “moderat” eingestuft wurde und welche Studien dafür herangezogen wurden. Ohne diese Bewertung gibt es keinen Cochrane Review. Die Qualitätsbewertung ist die erste Schicht.

Das ist aufwendig. Aber ohne diese Schicht baut man alles Weitere auf Annahmen.

Zweite Schicht: Interpretation

Die zweite Schicht ist menschlich. Hier stehen Entscheidungen und Kontext. Warum haben wir uns für Markt A entschieden und nicht für Markt B? Was bedeutet die neue Regulierung für unser Geschäft? Wo sind die Lücken in unserer Datenlage?

Das ist nicht automatisierbar. Es braucht Erfahrung und Urteilskraft. Eine KI kann beim Aufbau der ersten Schicht helfen. Die zweite nicht, jedenfalls nicht allein.

Dritte Schicht: Darstellung

Die dritte Schicht sind Dashboards, Berichte, Visualisierungen. Technisch nichts Neues. Aber sie funktionieren nur, wenn die ersten beiden Schichten stehen. Ohne saubere Fakten und dokumentierte Entscheidungen zeigt das beste Dashboard nur hübsch formatierte Unsicherheit.

Warum die Reihenfolge zählt

Palantir baut seit über zwanzig Jahren Systeme nach diesem Prinzip. In Foundry ist die Ontologie das Fundament. Der Wert steckt in der Struktur, nicht im Frontend.

Die grossen Beratungsfirmen haben mittlerweile eigene Systeme. Aber ich habe Kunden erlebt, die noch mit dem alten Modell arbeiten: Präsentation bestellen, Empfehlung bekommen, und am Tag danach ist die Folie veraltet. Wenn sich der Markt ändert, muss man die Berater nochmal buchen. Das ist eine Dienstleistung, kein Wissenssystem.

Die Reihenfolge macht den Unterschied. Wer mit der Darstellung anfängt, baut auf etwas, das er nicht überprüfen kann. Fängt man mit den Fakten an, kann man jede Darstellung erzeugen, die man braucht.

In einem eigenen Projekt habe ich 258 Findings aus 97 Studien extrahiert. Jedes mit Quellenangabe und Qualitätsbewertung nach GRADE. Das ist eine erste Schicht im Aufbau. Die Vernetzung fehlt noch, die Findings sind Karteikarten, kein Graph. Aber die Grundlage steht, und jede Darstellung, die ich später daraus baue, steht auf geprüften Fakten.

In meiner Erfahrung interessiert sich kein Stakeholder für einen Knowledge Graph. Was zählt, ist das Dashboard. Aber das Dashboard ist nur so gut wie die Daten darunter.