Sie sind hier: Startseite » Markt » Unternehmen

Daten sind Basis für alle Formen der KI


"Fivetran Modern Data Stack Event Series" in München: Digitalisierung beginnt mit Daten
Für die immensen Datenmengen, die für Large Language Models (LLM) nötig sind, unterstützt Fivetran alle wichtigen Data-Lake-Destinationen


Von Thomas Hahnel, Geschäftsführer Lucy Turpin Communications

Über zwei Billionen US-Dollar beträgt die Marktkapitalisierung von Nvidia aktuell – so viel wie alle Unternehmen des DAX 40 zusammen. Diese Summe zeigt, welche immense Bedeutung der künstlichen Intelligenz zugeschrieben wird, für die Nvidia mit seinen Prozessoren die Hardware liefert. Ebenso wichtig für KI-Anwendungen sind jedoch die Daten. Hier haben viele Unternehmen noch mit großen Herausforderungen zu kämpfen. Wie sie diese bewältigen können, war Thema der Fivetran Modern Data Stack Event Series, die kürzlich in München stattfand. Personio und sennder berichteten aus der Praxis.

Daten sind Basis für alle Formen der KI. Diese sind meist ausreichend vorhanden – Unternehmen sammeln mehr Daten als je zuvor. Das Problem besteht darin, dass Daten aus verschiedenen Quellen verknüpft werden müssen, um Erkenntnisse zu liefern. Wie das gelingt, hat Mark Van De Wiel, Field CTO von Fivetran, als Weg zur Data Maturity mit vier Stufen beschrieben. Er startet mit der Situation, dass Daten gar nicht genutzt werden und Entscheidungen ausschließlich aufgrund von persönlichem Wissen und Erfahrung getroffen werden.

Daten sind meist ausreichend vorhanden - Unternehmen sammeln mehr Daten als je zuvor, Bild: Fivetran


Auf die zweite Stufe gelangen Unternehmen, indem sie Daten aus verschiedenen Quellen verbinden können. Das gibt Ihnen die Möglichkeit, deskriptive Analysen und Ad-hoc-Reports zu erstellen. Das Problem: Jüngere Unternehmen erhalten oft unvollständige Analysen, etablierte haben mit einer Legacy- oder DIY-Infrastruktur zu kämpfen. "Hier scheitern zahlreiche Unternehmen", so die Erfahrung von Mark Van De Wiel. Denn die Zentralisierung von Daten ist eine komplexe Aufgabe: Der Aufbau und die Pflege von Datenpipelines sind zeit- und ressourcen-intensiv, die Pipelines meist von Unterbrechungen gekennzeichnet. Das führt zu langsamen Prozessen und einer mangelhaften Datenqualität, die sich nicht als Basis für vertrauenswürdige KI-Anwendungen eignet.

Nutzung moderner Technologien erfordert moderne Infrastruktur
Eine moderne Infrastruktur kann diese Probleme lösen und Unternehmen auf die dritte Stufe bringen. Hierfür hat sich der Modern Data Stack (MDS) etabliert. Diese Kombination aus Tools besteht in der Regel aus
• >> Datenpipelines, um Daten aus verschiedenen Quellen auf eine zentrale Datenplattform zu bringen,
• >> einem Data Warehouse oder Data Lake als zentrale Datenplattform,
• >> einem Datentransformationstool zur Aufbereitung der Rohdaten,
• >> einer Datenvisualisierungs- oder Business-Intelligence- (BI) Plattform zur Datenanalyse.

Mark Van De Wiel, CTO Field Chief CTO von Fivetran, erklärt: Daten sind meist ausreichend vorhanden - Unternehmen sammeln mehr Daten als je zuvor, Bild: Fivetran


"Weil sie alle auf Standards basieren, etwa SQL, und die Tool-Anbieter eng zusammenarbeiten und ein Ökosystem bilden, integrieren sich die Tools wirklich gut", so Van De Wiel. "Mit seiner vollständig verwalteten, automatisierten Data Movement Plattform ist auch Fivetran Teil des Modern Data Stack. Unsere Plattform ermöglicht Unternehmen, Daten aus verschiedenen Quellen zu zentralisieren – und zwar hochzuverlässig, sicher, effizient und schnell." Für die immensen Datenmengen, die für Large Language Models (LLM) nötig sind, unterstützt Fivetran alle wichtigen Data-Lake-Destinationen. Durch die RAG- (Retrieval Augmented Generation) Architektur kann die Lösung Generative-KI-Modelle um die erforderlichen Daten ergänzen.

Fivetran verbindet durch vollständig verwaltete Datenpipelines zahlreiche Quellen (oben) mit unterschiedlichen möglichen Zielen (unten), Bild: Fivetran


Unternehmen verfügen auf dieser dritten Stufe also über Daten mit hoher Qualität, bei Bedarf in Echtzeit. Damit haben sie Basis geschaffen nicht nur für detaillierte Auswertungen und Predictive Analytics sowie unternehmensweit standardisierte Reports, sondern auch für KI, ML und LLM.

"Es gibt noch eine vierte Stufe, weil Unternehmen jetzt dafür sorgen müssen, diesen Status trotz Veränderungen seitens der Datenquellen, der Nutzer oder des Unternehmens zu erhalten und zu skalieren – und zwar so, dass die Datenteams nicht zu viel Zeit dafür aufwenden müssen, die dann für wertschöpfende Tätigkeiten fehlt", erklärt Van De Wiel. Als Lösung beschreibt er zwei Maßnahmen: erstens durch Self-Service-Datenzugriff für die Mitarbeitenden das Datenteam entlasten, und zweitens die technologisch versierten Mitarbeitenden mit den nötigen Tools auszustatten, sodass sie ihre Datenbewegungen in den eigenen Datenbanken innerhalb des Modern Data Stack selbst verwalten können. Das ist möglich, weil in einem modernen Data Warehouse oder Data Lake die Datenverarbeitung und -speicherung getrennt sind.

Hier angekommen können Unternehmen wirklich innovativ sein. Sie können Daten nutzen, um den Markt und das Unternehmen zu verstehen und mit Hilfe modernster Technologien neue Möglichkeiten zu schaffen. Die Ergebnisse: Steigerung der Effizienz, Entwicklung leistungsfähiger neuer Produkte und das Erzielen von Umsatzerlösen aus Datenprodukten und der Weiterentwicklung des Unternehmens.

Praxisbeispiel Morgan Stanley
Ein Unternehmen, das bereits alle vier Stufen zur Data Maturity genommen hat, ist Morgan Stanley. Der Fivetran-Kunde hat seine Datensilos aufgebrochen, ist in die Cloud migriert und hat eine neue Datenarchitektur mit Fokus auf Datenzugriff und Echtzeitdaten aufgesetzt. Damit wuchs die Gruppe der internen Datennutzer innerhalb von vier Jahren von ca. 100 auf rund 2.000. Auf Basis von KI und Machine Learning kann das Unternehmen jetzt innovative Lösungen schaffen. Zum Beispiel nutzen die Finanzberater keinen marktorientierten Ansatz mehr, sondern können mit einem individuellen Ansatz die besten Empfehlungen für jeden einzelnen Kunden ermitteln – ein großer Wettbewerbsvorteil.

Der Digitalisierungsweg von Personio und sennder
Personio, europaweit führende HR-Software für KMU, und sennder, Europas führende Spedition, berichteten auf dem Fivetran Modern Data Stack Event von ihrem Weg zum datenbasierten Unternehmen. Dieser begann ebenfalls mit der Zentralisierung der Daten.

Personio setzte anfangs auf selbstentwickelte Tools auf Basis von AWS-Services und APIs. Weil sich vor allem die APIs sehr oft ändern, war das Datenteam stark damit beschäftigt, die Tools aktuell zu halten. Dadurch blieb kaum Zeit, um aus den Daten einen Mehrwert für das Unternehmen zu schaffen.

sennder startete mit einem kundenspezifischen Airflow-Setup, mit dem Daten aus zwei Quellen in eine Postgres Datenbank geladen wurden. Auch hier verbrachte der Data Engineer den Großteil seiner Zeit mit Maintenance-Aufgaben. Als sennder sein erstes exponentielles Wachstum erlebte, zeigt sich ein weiterer, großer Nachteil: Die Datenbank war nicht skalierbar. Deshalb entschied sich die digitale Spedition dafür, einen Modern Data Stack aufzubauen. Diese besteht aus Snowflake als Daten-Plattform, Fivetran als Data Movement Platform, dbt für die Datentransformation und Looker als BI-Tool.

Heute kann sich das sennder-Datenteam auf die Aufgaben konzentrieren, die das Unternehmen voranbringen. Jeder Mitarbeitende hat Zugriff auf die für ihn relevanten Daten und kann im Self-Service BI-Dashboards erstellen, um datengestützte Entscheidungen zu treffen. Darüber hinaus nutzt sennder die Daten für das Training von ML-Modellen und die Entwicklung datengestützter Produkte.

Raffael Dzikowski, Staff Data Platform Engineer bei Personio: Personio setzte anfangs auf selbstentwickelte Tools auf Basis von AWS-Services und APIs. Weil sich vor allem die APIs sehr oft ändern, war das Datenteam stark damit beschäftigt, die Tools aktuell zu halten, Bild: Fivetran


Technologie ist nicht alles
Auf einen weiteren entscheidenden Aspekt machte Raffael Dzikowski, Staff Data Platform Engineer bei Personio, aufmerksam: "Man kann die beste Plattform der Welt mit tollen Features aufbauen. Aber wenn sie für die Nutzer zu kompliziert ist, wird es kein Erfolg." Das Thema griff auch Edwin Commandeur, Principal Field Product Manager bei Fivetran, in seinem Vortrag auf. Er empfahl dringend, verpflichtende Schulungen durchzuführen, damit alle in der Organisation die Daten verstehen und wissen, wie sie sie für ihre spezifischen Anwendungsfälle effektiv nutzen können. Auch das Thema Sicherheit müsse Bestandteil der Schulungen sein.

Weitere Erfolgsfaktoren sind laut Commandeur die nötigen technischen und personellen Ressourcen sowie Prozesse, die auf die Nutzung des Modern Data Stack angepasst sind. "Als wichtigsten und gleichzeitig schwierigsten Punkt sehe ich jedoch, die gemeinsame Nutzung von Daten durchzusetzen", ergänzt Commandeur. "Ich finde es nachvollziehbar, dass viele Teams ihre Daten nur ungern zur Verfügung stellen. Doch für eine umfassende Datennutzung mit solidem Erkenntnisgewinn führt kein Weg daran vorbei. Ein Fivetran-Kunde hat das gelöst, indem er die Daten klassifiziert und Regeln formuliert hat, wie sie genutzt werden dürfen."

Personio hat diese Notwendigkeit auch erkannt und zahlreiche Trainings durchgeführt, um alle Mitarbeitenden in dem Prozess mitzunehmen und ein Mindset zu etablieren, in dem Daten als wertvolle Ressource begriffen werden. Auf der technologischen Ebene hat sich Personio für Fivetran entschieden. "Damit konnten wir unsere Quellen sehr einfach in Minutenschnelle anbinden", erinnert sich Raffael Dzikowski. "Die Datenpipelines sind robust und stabil, sodass wir die Gewissheit haben, immer korrekte, aktuelle Daten zu nutzen, auch Echtzeitdaten, wo das nötig ist. Und unser Datenteam hat jetzt auch die Zeit, um damit Innovationen zu schaffen." (Fivetran: ra)

eingetragen: 14.05.24
Newsletterlauf: 15.07.24

Fivetran: Kontakt und Steckbrief

Fivetran automatisiert alle Arten von Data Movement im Zusammenhang mit Cloud-Datenplattformen. Das gilt vor allem für die zeitaufwendigsten Teile des ELT-Prozesses (Extract, Load, Transform) - von der Extraktion von Daten über das Handling von Schema-Drifts bis hin zu Daten-Transformationen. Damit können sich Data Engineers auf wichtigere Projekte konzentrieren, ohne sich um die Data Pipelines kümmern zu müssen. Mit einer Up-Time von 99,9 Prozent und sich selbst reparierenden Pipelines ermöglicht Fivetran Hunderten von führenden Marken weltweit, darunter Autodesk, Lionsgate und Morgan Stanley, datengestützte Entscheidungen zu treffen und so ihr Unternehmenswachstum voranzutreiben. Fivetran hat seinen Hauptsitz in Oakland, Kalifornien, und verfügt über Niederlassungen auf der ganzen Welt.

Der deutschsprachige Markt wird aus dem Büro in München betreut. Zu den Kunden in Deutschland zählen DOUGLAS, Hermes, Lufthansa, Siemens, VW Financial Services und Westwing. Weitere Informationen unter www.fivetran.com.

Kontaktdaten
Fivetran
Luise-Ullrich-Straße 20
80636 München, Deutschland
E-Mail: hallo[at]fivetran.com
Webseite: https://fivetran.com/de

Dieses Boilerplate ist eine Anzeige der Firma Fivetran.
Sie zeichnet auch für den Inhalt verantwortlich.

Lesen Sie mehr:
KI erfordert riesige Mengen hochwertiger Daten
Datenintegration für Unternehmen jeder Größe
Fivetran vereinfacht Datenintegration
Nahtlose Replikation großer Datensätze
Die Datenkultur hat sich grundlegend gewandelt
Data Governance und Datensicherheit
Fivetran weiter auf der Erfolgsspur
Cloud-Deployment für Fivetran-Plattform
Fivetran erweitert Partnerschaft mit Snowflake
Datenautobahn ohne Stau für die Logistik
Nutzung von KI- und Generative-KI-Technologien
Data Lake Management automatisiert und vereinfacht
Daten sind Basis für alle Formen der KI
Schlechte Datenpraktiken noch weit verbreitet
Datenbasierte Entscheidungen treffen
Datenaustausch im Unternehmen automatisieren
Reduzierte Latenzzeiten und Kosten
25 Jahre Erfahrung im SaaS-Umfeld
Fivetran sorgt für Business Insights
Kontrollierte, benutzerfreundliche Repositories
Aufbau einer soliden Data-Lake-Grundlage
Cloud Data Lake, Lakehouse oder Warehouse
Skalierbare Konnektoren und Destinationen
Fivetran als Launch-Partnerin
Prozess zur Datenintegration in BigQuery
Weniger Kosten für Neukundengewinnung
Inspirierende Führungspersönlichkeit
Anbindung an praktisch jede SaaS-Anwendung
Unterstützung von Amazon S3
Fivetran setzt Wachstum fort
Daten in Cloud- & On-Premise-Umgebungen
Fivetran: Führungsteam ausgebaut
Data Act könnte schon 2024 in Kraft treten
Mit Cloud-Architektur zum "Master of Data"
Vorteile automatisierter Datenintegration
Schwierigkeiten bei der Bereitstellung der Daten


Meldungen: Unternehmen

  • Interaktion mit Public-Cloud-Compute-Services

    Leaseweb, Anbieterin von Cloud-Diensten und Infrastructure as a Service (IaaS), gibt einen wesentlichen Fortschritt in seinem Beitrag zu den wichtigen EU-Projekten von gemeinsamem europäischem Interesse für Cloud-Infrastrukturen und -Dienste (IPCEI-CIS) bekannt: Mit dem Projekt "European Cloud Campus" legt Leaseweb aktiv den Grundstein für eine souveräne europäische Cloud, um sensible Daten zu schützen, EU-Vorschriften einzuhalten und sicherzustellen, dass Europas digitale Infrastruktur nicht länger von US-Anbietern abhängig ist.

  • Engagement für Sicherheit & Compliance

    SailPoint, Anbieterin von einheitlicher Identitätssicherheit für Unternehmen, hat das C5-Testat (Cloud Computing Compliance Criteria Catalogue) des Bundesamts für Sicherheit in der Informationstechnik (BSI) erhalten. Damit erfüllt SailPoint offiziell die strengen Anforderungen an Datenschutz, Betriebssicherheit und den Schutz vor Cyberangriffen für Cloud-Dienste in Deutschland.

  • Edge-Gateway-Plattform & Managed TI-Services

    Ob TI-Gateway oder klassische TI-as-a-Service (TIaaS), Kommunikation im Medizinwesen (KIM) oder digitale Healthcare-Anwendungen: Die Zukunft des Gesundheitswesens liegt in der Bereitstellung von Managed Services. Um diese vertrauensvoll zu gestalten, arbeiten secunet, Deutschlands führendes Cybersecurity-Unternehmen, und Akquinet ab sofort zusammen.

  • Sichere Nutzung der Cloud

    Die Spezialistin für die Sicherheit von cyber-physischen Systemen (CPS) Claroty zeigte auf der diesjährigen Hannover Messe, wie Industrieunternehmen das volle Potenzial der digitalen Transformation durch die sichere Nutzung der Cloud ausschöpfen können. Auf dem gemeinsamen Stand mit Amazon Web Services (AWS) (Halle 15, Stand D76) stellten hierfür die Experten das gemeinsam entwickelte Framework zum Schutz der Kommunikation zwischen Benutzern, Maschinen und Cloud-Workloads vor.

  • Anerkannter ITSM-Best-Practice-Standard

    "ServiceDesk Plus", die KI-gestützte Unified-Service-Management-Plattform von ManageEngine, eine Geschäftssparte der Zoho Corporation und führender Anbieter von IT-Management-Lösungen für Unternehmen, hat die ITIL-Zertifizierung für 14 IT-Service-Management-Anwendungsfälle (ITSM) erhalten. Diese Zertifizierung wird von PeopleCert, einem führenden internationalen Anbieter von Schulungen und Zertifizierungen vergeben und bedeutet, dass ManageEngine als Silber-Mitglied dem ATV-Programm von PeopleCert beitritt. Dies bestätigt noch einmal den Einsatz von ManageEngine, eine ITSM-Plattform zu entwickeln, die auf branchenweit anerkannten Best Practices basiert.

  • "Auditor"-Zertifizierung von Cloud-Diensten

    Nachdem der Europäische Datenschutzausschuss (EDSA) und Datenschutz-Aufsichtsbehörde LDI NRW bereits im Juni 2024 Auditor als Datenschutzzertifizierung gemäß Artikel 42 DSGVO anerkannt haben, ist jetzt der letzte Schritt zum Einsatz am Markt vollzogen. Die Deutsche Akkreditierungsstelle (DAkkS) hat die datenschutz cert GmbH als erste Zertifizierungsstelle akkreditiert. Diese Akkreditierung bestätigt, dass die datenschutz cert GmbH die Anforderungen für die Konformitätsbewertung von Cloud-Diensten erfüllt und somit berechtigt ist, die Datenschutzzertifizierung Auditor zu vergeben.

  • Einhaltung der Gaia-X-Labels

    CISPE (Cloud Infrastructure Services Providers in Europe) und Gaia-X integrieren das "CISPE Gaia-X Digital Clearing House" in das Gaia-X-Ökosystem. Dieser bedeutende Schritt ermöglicht es Cloud-Kunden, Dienste auszuwählen und zu erwerben, die nachweislich den im Gaia-X Compliance-Dokument (Release 24.11) beschriebenen Richtlinien entsprechen.

  • Erfolgsbilanz bei Java-Innovationen

    Azul Systems, ein Unternehmen, das sich zu 100 Prozent auf Java konzentriert, gab eine Dynamik für ihr kürzlich abgeschlossenes Geschäftsjahr bekannt - mit einem Anstieg der Neukundenbuchungen um 63 Prozent im Vergleich zum Vorjahr. Dieses Wachstum spiegelt die steigende Nachfrage von Unternehmen sowohl nach leistungsstarken Java-Plattformen als auch nach kostengünstigen, kommerziell unterstützten Java-Lösungen wider: Unternehmen versuchen, die Cloud-Kosten einzudämmen und sich von den Preis- und Lizenzierungsstrukturen von Oracle zu lösen.

  • Fortschritten bei der Cloud-Migration

    Unit4, Anbieterin von Cloud-basierten Unternehmensanwendungen für kunden- und mitarbeiterorientierte Organisationen, gab wichtige Meilensteine bekannt, die das Unternehmen erreicht hat. Zu diesen Entwicklungen gehören bedeutende Fortschritte bei der Cloud-Migration von Kunden, die Einführung einer neuen Stufe von Serviceangeboten und die Aufnahme neuer Führungskräfte in Schlüsselpositionen.

  • Best Practices aus der Fertigung

    Was, wenn Produktionsunternehmen ihren Zeit- und Kostenaufwand entlang der gesamten Wertschöpfungskette halbieren könnten: vom Materialeinkauf über die Logistik bis hin zur Buchhaltung? Als roter Faden vernetzt ein Cloud-ERP-System alle Geschäftsprozesse und verschlankt sie messbar. Fünf Unternehmen zeigen, wie sich das konkret in ihren Kennzahlen niederschlägt.

Wir verwenden Cookies um unsere Website zu optimieren und Ihnen das bestmögliche Online-Erlebnis zu bieten. Mit dem Klick auf "Alle akzeptieren" erklären Sie sich damit einverstanden. Erweiterte Einstellungen