Künstliche Intelligenz (KI) ist das Trendthema schlechthin. Kein Wunder möchten viele Unternehmen KI in ihre Digitalisierungsstrategie einbeziehen. Die wenigsten sind sich jedoch über die Anforderungen und Möglichkeiten dieser Technologie im Klaren. Das Resultat: Trotz hoher Investitionen ist die gewonnene KI nicht so intelligent, wie man es gerne hätte. Dabei liegt das Problem meist nicht an der KI selbst, sondern an den ihr zur Verfügung stehenden Daten.
Data Streaming – der Schlüssel zur KI
Der Schlüssel zu datengetriebenen Entscheidungen und zur Nutzung von KI liegt nämlich in der Verfügbarkeit aktueller und konsistenter Daten. Möglich wird dies dank Data Streaming, einer Technologie, welche kontinuierlich erzeugte Daten in Echtzeit erfasst, verarbeitet und analysiert. Im Gegensatz zu traditionellen Batch-Verarbeitungsmodellen, bei denen Daten in festen Intervallen gesammelt und verarbeitet werden, ermöglicht Data Streaming eine stetige und nahezu sofortige Verarbeitung von Daten und liefert damit beispielsweise einer KI aktuelle und relevante Informationen.
Doch wie entstehen aus verworrenen und über diverse Systeme verteilten Daten solche Datenflüsse? Die Implementierung von Data Streaming erfordert nicht nur eine sorgfältige Auswahl der richtigen Technologien und Tools, sondern auch eine klare Strategie. Nur mit den richtigen Datenquellen liefert die KI brauchbare Antworten. Deshalb muss zunächst die Konnektivität zu den relevanten Systemen respektive Datenquellen gewährleistet sein. Anschliessend lassen sich in den Quellen auftretende Events in Echtzeit in sogenannten Data-Streaming Plattformen wie Apache Kafka einspeisen. Plattformen wie Kafka dienen jedoch nicht nur als Datensammelbecken. Vielmehr bilden sie eine Art zentrales Nervensystem, indem sie die Events mit geringer Latenz verarbeiten und analysieren.
Data Streaming + KI = unendliche Möglichkeiten
Manche mögen sich nun fragen, ob sich dieser Aufwand überhaupt rechnet oder ob eine Unternehmenslizenz von ChatGPT nicht doch reichen würde. In diesem Zusammenhang ist wichtig: KI ist nicht gleich KI. ChatGPT wird nie so spezifische Auskünfte erteilen können wie eine KI, die in Echtzeit auf Unternehmensdaten zugreifen kann. Gerade im Business-Kontext eröffnet KI in Kombination mit Data Streaming völlig neue Möglichkeiten, insbesondere wenn Retrieval Augmented Generation (RAG) ins Spiel kommt.
RAG ist eine Technik, welche Generative Artificial Intelligence (GenAI) mit einem Retrieval Modell kombiniert, um relevante Informationen aus verschiedenen Unternehmensdatenbanken abzurufen. Dies geschieht in zwei Schritten: Zunächst durchsucht das Retrieval-Modell eine grosse Menge an Dokumenten, Datenbanken oder Wissensbasen mithilfe einer Vektordatenbank, um relevante Informationen zu einer bestimmten Anfrage zu finden. Diese Daten werden abgerufen und an die GenAI weitergegeben, welche die Informationen anschliessend nutzt, um eine detaillierte und präzise Antwort zu generieren. Dadurch kann eine KI mit RAG auf spezifische Fragen präziser und kontextbezogener antworten. Der interne Chatbot wird so zum unverzichtbaren Besserwisser.
Auch – oder sogar besonders – für KMUs lohnt sich dieses Vorgehen. Für sie ist das Trainieren eigener KI-Modelle oft nicht erschwinglich. RAG bietet hier eine sehr effiziente Alternative, um auf Unternehmensdaten zugreifen zu können, ohne eigene KIs zu trainieren. Damit dies gelingt, braucht es Datenkonsistenz. Besonders bei relevanten Geschäftsdaten ist es wichtig, dass sie während ihres gesamten Lebenszyklus – von der Erfassung über die Verarbeitung bis hin zur Speicherung und Analyse – in einem korrekten und über die verschiedenen Applikationen hinweg konsistenten Zustand sind. Schliesslich mag niemand eine KI, die ständig ihre Meinung ändert.
Mit KI in die Zukunft blicken
Dank RAG kann eine KI jedoch viel mehr als nur die richtigen Informationen zur richtigen Zeit anzeigen. Mit Data Streaming und RAG wird KI zu einem modernen Orakel. Beispielsweise können Unternehmen der Industriebranche Data Streaming und KI nutzen, um sogenannte Predictive Maintenance durchzuführen. Durch die Überwachung von Maschinendaten in Echtzeit können Anomalien erkannt und Wartungsarbeiten geplant werden, bevor es zu tatsächlichen Ausfällen kommt. Aber auch andere Branchen profitieren von dieser Technologie. Im Finanzsektor können Echtzeit-Datenanalysen und KI-Modelle zur Betrugserkennung eingesetzt werden. Durch die kontinuierliche Überwachung von Transaktionen können ungewöhnliche Muster sofort erkannt und betrügerische Aktivitäten verhindert werden.
Es gäbe noch zahlreiche weitere Beispiele. Fest steht: Wollen Unternehmen das volle Potenzial von KI nutzen, ist die Einbindung der Unternehmensdaten und somit die Einführung von Data Streaming Pflicht. Durch die Echtzeit-Verarbeitung, Skalierbarkeit, verbesserte Datenqualität und reduzierte Latenzzeiten schafft Data Streaming die notwendige Infrastruktur, um fortschrittliche KI-Anwendungen erfolgreich zu implementieren. Und in einer Welt, die zunehmend von Daten und digitalen Technologien geprägt ist, stellt die Integration von Data Streaming und KI einen bedeutenden Wettbewerbsvorteil dar.
Dieser Artikel wurde ursprünglich in der Themenbeilage FokusAI der Bilanz Nr. 7 / 2024 publiziert.