6 Minuten Lesezeit 1 März 2024
Junge Frau experimentiert mit immersiver Erfahrung bei Nacht

Warum eine umfassende Datenstrategie wichtig bei der Einführung von KI ist

Von Rudraksh Bhawalkar

Partner Technology Consulting - Data & AI, Ernst & Young GmbH Wirtschaftsprüfungsgesellschaft | Deutschland

Non-Equity-Partner bei EY, wo er die Bereiche Data Modernization, Data Driven Enterprise, Trustworthy AI und Data Led Sustainability leitet

6 Minuten Lesezeit 1 März 2024

Data Governance, Master Data Management und Data Quality spielen eine wichtige Rolle bei der KI-Bereitschaft eines Unternehmens.

Überblick
  • Mit dem Aufkommen generativer KI und großer Sprachmodelle werden Daten wichtiger denn je.
  • Unternehmen müssen sich auf Datenrichtlinien, Datenmodernisierung, Compliance und Datenkompetenz konzentrieren, um KI-bereite Daten zu schaffen.
  • Change Management und Datenkompetenz sind wichtig, um eine datengestützte Unternehmenskultur zu etablieren und den Erfolg von KI-Projekten zu gewährleisten.

Mit dem Zuwachs von generativer künstlicher Intelligenz (KI) und großen Sprachmodellen (Large Language Models) haben Daten eine größere Bedeutung als je zuvor. Es gibt unzählige Anwendungsfälle, in denen KI und generative KI unterstützend eingesetzt werden können. Dabei bleiben Daten das zentrale Element, und um den Wert von generativer KI vollständig auszuschöpfen, sind KI-fertige Daten erforderlich.

Um Daten für die KI aufzubereiten und eine Kultur der Innovation zu schaffen, sollte jedes einzelne Unternehmen zum Datenschutz beitragen. Um dies zu erreichen, müssen Sie sich auf vier Hauptbereiche konzentrieren:

  • Datenrichtlinien
  • Datenmodernisierung
  • Compliance, ethische Grundsätze und Vertrauen
  • Datenkompetenz und Change Management

Schauen wir uns nun jeden der Hauptbereiche einmal genauer an, um zu verstehen, wie sich diese zum Erreichen des Ziels KI-bereiter Daten aufstellen können.

Daten-Governance

Daten-Governance ist keine neue Praxis. Es gibt den Bereich schon seit Längerem, aber dennoch wird er am meisten vernachlässigt. In den meisten Unternehmen existieren Datenrichtlinien in einzelnen Bereichen, zuweilen in einer föderierten Umgebung, manchmal zentral und in einer Hybridform. Um jedoch das gesamte Potenzial der Datenrichtlinien auszuschöpfen, muss man den Reifegrad der Organisation mit einbeziehen und in einem zweiten Schritt das gewünschte Modell implementieren. Die wichtigsten Aspekte der Datenrichtlinien sind die Identifizierung der geeigneten Rollen und Verantwortlichkeiten, die Implementierung der richtigen Prozesse und die angemessene Befähigung durch die jeweilige Technologie, unterstützt durch die entsprechenden Werkzeuge. Kombiniert bieten die Aspekte Prozesse, Technologie und Mitarbeitende den geeigneten Mix und die entscheidende Triangulation, um das angemessene Maß an Datenrichtlinien zu erreichen.

Um jedoch das gesamte Potenzial der Datenrichtlinien auszuschöpfen, muss man den Reifegrad der Organisation kennen und dann das gewünschte Modell implementieren.

Die beiden Hauptbereiche der Datenrichtlinie sind die Datenqualität und das Stammdatenmanagement. Beides ist für jede Organisation dringend erforderlich, um eine geeignete Datengrundlage zu schaffen. Der Reifegrad des Stammdatenmanagements und der Datenqualität wird durch ein Target Operating Model erreicht, das alle Mitarbeitenden einbindet – von der Geschäftsführung bis hin zum Team –, die die geschäftlichen und technischen Metadaten erstellen, implementieren und die KPIs festlegen, um eine universal gültige Version aller Daten zur Verfügung zu stellen.

Datenmodernisierung

Die Datenmodernisierung ist ein recht neues Element in der Praxis, wenn es um Daten zur Unterstützung der digitalen Transformation geht. Alle Unternehmen streben in die Cloud, skalieren ihren Wert durch Daten und wollen Daten zum richtigen Zeitpunkt der richtigen Person zur Verfügung stellen. Dadurch sowie durch das Aufkommen von KI und generativer KI werden die Anwendungsfälle immer komplexer, sodass wir neue Lösungen brauchen, um die neuen Probleme zu lösen. Neue Plattformen wie Microsoft Fabric, Databricks und Snowflake stellen eine durchgängige zentrale Lösung für die gesamte Datenwertschöpfungskette beginnend mit der Datenintegration zur Verfügung und bieten gleichzeitig Funktionen für die Datenqualität, das Daten-Profiling, das Stammdatenmanagement, die Rückverfolgbarkeit und den Datenschutz. Sie erleichtern darüber hinaus die Verwaltung von Daten, indem sie die Einteilung von Daten in die Klassen Bronze, Silber und Gold ermöglichen. Unterschiedliche Adressaten und Nutzer der Daten können darin in Echtzeit auf Informationen zugreifen und sie auch für nachgelagerte KI-Anwendungen nutzen.

Alle Unternehmen wollen in die Cloud wechseln, ihren Wert durch Daten skalieren und die richtigen Daten zum richtigen Zeitpunkt der richtigen Person zur Verfügung stellen. Dadurch sowie durch das Aufkommen von KI und generativer KI werden die Anwendungsfälle immer komplexer, sodass wir neue Lösungen für die neuen Probleme brauchen.

Heutzutage verfügen Plattformen wie Databricks und Snowflake über eigene Governance-Funktionen. So können sie Daten aufspüren, Metadaten nachverfolgen und einen Datenkatalog zur einfacheren Implementierung der Daten-Governance bereitstellen und somit die Aufbereitung der Daten für die KI unterstützen.

Eine weitere großartige Innovation in diesem Bereich ist die Verwendung von Daten als Produkt, die durch die Datamesh-Architektur unterstützt wird. Ein Datenprodukt ist ein wiederverwendbarer Datenbestand, der auf der Grundlage des beabsichtigten Geschäftswerts zweckmäßig konzipiert wurde.

Compliance, ethische Grundsätze und Vertrauen

Aufgrund der zahlreichen KI- und datenbezogenen Vorschriften, die weltweit in Kraft oder in Vorbereitung sind, wie die Datenschutz-Grundverordnung der Europäischen Union (DSGVO) und das EU-Gesetz zur künstlichen Intelligenz (Artificial Intelligence Act) in Europa, der California Consumer Privacy Act (CCPA) in den USA und eine Vielzahl anderer Vorschriften, ist es wichtig, dass man über ein geeignetes Datenmanagement und eine Daten-Governance verfügt. Die Einbindung der richtigen Maßnahmen im Hinblick auf Datensicherheit, -zugriff und -steuerung ist essenziell, da Cyberbedrohungen jeden Tag zunehmen. Wenn man Daten verwendet, um auf KI und generativer KI basierende Large Language Models zu trainieren, ist es darüber hinaus äußerst wichtig, die richtigen Daten zu verwenden, um Verzerrungen zu vermeiden, den Datenschutz zu stärken, die Resilienz zu verbessern und die Robustheit der Modelle zu erhöhen. Die Umsetzung umfassender Datensicherheitsmaßnahmen und deren Einhaltung ist daher das Gebot der Stunde und sollte nicht ignoriert werden.

Die Umsetzung umfassender Datensicherheitsmaßnahmen und deren Einhaltung ist daher das Gebot der Stunde und sollte nicht ignoriert werden.

Als Adressaten, Nutzer, Erzeuger und Vertreiber von KI-Anwendungen und Daten ist es die Pflicht von Unternehmen und Einzelpersonen, die Anforderungen einzuhalten und verantwortungsvolle KI- sowie Sicherheitsmaßnahmen in das Konzept zu integrieren. Dies zeichnet verantwortungsvolle Unternehmen aus und trägt dazu bei, Nachhaltigkeitsziele zu erreichen, indem ein geeignetes Umfeld zur Verfügung gestellt wird, in dem Mitarbeitende fair behandelt, Informationen geschützt und langfristige Grundlagen für die KI geschaffen werden können.

Datenkompetenz und Change Management

Die in Unternehmen am stärksten vernachlässigten und unterschätzten Themen sind Change Management und Datenkompetenz, die erforderlich sind, um eine datengestützte Unternehmenskultur zu etablieren. Ganz egal, wie fortschrittlich die Nutzung von KI und Daten im Unternehmen ist – wenn die entsprechenden Mitarbeitenden nicht zum richtigen Zeitpunkt angemessen geschult werden und keine Datenkompetenz aufgebaut wird, werden letztendlich alle großen und kleinen Projekte scheitern. Es ist äußerst wichtig, die richtigen Funktionen und Verantwortlichkeiten sowie das entsprechende Verständnis für die Nutzung von Daten, Tools und Technologien als Enabler im Unternehmen zu haben, um erfolgreich zu sein. Dies ist nur möglich, wenn sich Einzelpersonen und Teams darüber im Klaren sind, was sie durch die richtige Nutzung von Daten erreichen können, was dies für sie und für die Organisation in Bezug auf strategische Ziele bedeutet und wie diese Ziele schließlich mit ihren Datenanforderungen verknüpft sind.

Daher ist es essenziell, über das richtige Target Operating Model zu verfügen, in dem sogenannte Change Champions mithilfe schriftlicher Daten und technologischen Wissens die strategischen Ziele der Organisation mit den Zielen der Teams verknüpfen und mit ihnen gemeinsam daran arbeiten, die Arbeitsmethoden durch die richtigen Prozesse, Mitarbeitenden und Technologien zu verbessern.

Das Change Management ist der Bereich in einem Unternehmen, der von der Geschäftsführung am dringendsten unterstützt werden muss. Er sollte konsequent von oben nach unten durchgesetzt werden, wobei der wichtigste Aspekt eine unmissverständliche, einfache und wirksame Kommunikation ist.

Das Change Management ist der Bereich in einem Unternehmen, der von der Geschäftsführung am dringendsten unterstützt werden muss. Er sollte konsequent von oben nach unten durchgesetzt werden, wobei der wichtigste Aspekt eine unmissverständliche, einfache und wirksame Kommunikation ist. Dies kann mithilfe eines geeigneten Anreizprogramms erreicht werden, das Einzelpersonen und Gruppen von Mitarbeitenden dazu motiviert, das Unternehmen gemeinsam zum Erfolg zu führen.

Fazit

Es bleibt festzustellen, dass es nicht allzu schwierig ist, Daten für die KI aufzubereiten. Alles, was es dafür braucht, sind angemessene Unterstützung, Methoden und Disziplin. Um die digitale Transformation, den Übergang in die Cloud und die Datenmodernisierung erfolgreich durchzuführen und eine datengestützte Unternehmenskultur erfolgreich zu etablieren, bedarf es geeigneter Standards, Kontrollen und Richtlinien. Wenn man mithilfe von Daten und KI den größtmöglichen Wert erzielen, Mitarbeitenden und Kunden eine positive Erfahrung bieten, die Ertragslage verbessern und gleichzeitig Nachhaltigkeitsziele erreichen möchte, sind KI-bereite Daten unerlässlich.

Über diesen Artikel

Von Rudraksh Bhawalkar

Partner Technology Consulting - Data & AI, Ernst & Young GmbH Wirtschaftsprüfungsgesellschaft | Deutschland

Non-Equity-Partner bei EY, wo er die Bereiche Data Modernization, Data Driven Enterprise, Trustworthy AI und Data Led Sustainability leitet