Beschleunigung von KI mit einem offenen, modernen Data Lakehouse

Einführung des Dell Data Lakehouse: Stärken Sie Ihr Unternehmen überall mit KI aus Daten überall

Im vergangenen Oktober habe ich über die Herausforderungen geschrieben, die Organisationen daran hindern, das volle Potenzial der KI zur Steuerung von Geschäftsergebnissen zu entfalten. Seitdem hat der kontinuierliche Aufstieg der KI noch stärkeres Licht auf eine der wichtigsten Zutaten einer erfolgreichen KI-Strategie geworfen: eine KI-bereite Datenplattform.

In einer Landschaft, die von dezentralen Daten, Legacy-Systemen, Datenschutzbedenken und Cloud-nativen Anwendungen geprägt ist, die nur mit Daten in der Cloud arbeiten, kämpfen Organisationen weiterhin. Forschungen der Boston Consulting Group haben ergeben, dass bei mehr als 50% der Datenführer die architektonische Komplexität ein Hauptproblem darstellt – Organisationen in erhebliche Komplexität zwingt, vermeidbare Kosten generiert und wertvolle Zeit bis zum Mehrwert verliert.

Datenpraktiker stehen vor großen Herausforderungen. Traditionelle Datenlager beschränken Daten auf proprietäre Formate, was den universellen Zugang behindert. Daten-Lakes fehlen Zuverlässigkeit und Governance und bieten keine gute Leistung. Und Zwei-Ebenen-Architekturen bieten zwei suboptimale Optionen: Entweder verwenden Sie hochwertige, aber alte Daten aus einem Lagerhaus oder verwenden Sie frische, aber unzuverlässige Daten aus einem See. Die Entstehung von Data Lakehouses zielt darauf ab, diese Probleme zu lösen, aber die Auswahlmöglichkeiten bleiben unzureichend. Cloud-Lösungen erfordern Migration und sind bei großem Maßstab kostspielig. On-Premise-Lösungen sind durch Legacy- und proprietäre Technologien belastet. Und Open Source, obwohl innovativ, bringt hohe Integrationskosten mit sich.

Auch IT-Teams haben Probleme. Die Konsolidierung verschiedener Datenquellen in eine einzige Datenquelle ist ein nie endender Aufwand. Die Verwaltung einer wachsenden Anzahl von Dateninfrastruktur-Tools belastet die Ressourcen. Die Komplexität der Überwachung mehrerer Komponenten unterstreicht die Notwendigkeit von Einfachheit.

Kunden verdienen offensichtlich eine bessere Antwort. Und genau wie ich schon früher gesagt habe, eine Antwort, die mit ihrer Datenanziehungskraft arbeitet und nicht dagegen. Eine Antwort, die Einfachheit bringt und die Wertschöpfung beschleunigt.

Heute markiert einen aufregenden Meilenstein, denn wir halten unser Versprechen ein, indem wir die allgemeine Verfügbarkeit des Dell Data Lakehouse ankündigen. Dieses neue Angebot bietet Kunden eine vollständig integrierte Datenplattform, die auf Dell KI-optimierter Hardware und einer Software-Suite auf Full-Stack-Basis basiert, die von Starbursts leistungsstarkem und innovativem Abfrage-Engine angetrieben wird.

„Während Dell weiterhin die Entwicklung in den Bereichen Speicher und Berechnung anführt, bietet Starburst stolz sein leistungsstarkes Daten-Lakehouse-Analyseangebot und seine Expertise an. Genau wie die Speichertechnologie von Dell das Fundament des Daten-Sees bildet, dient Starburst als dynamischer See-Hausmotor und harmonisiert Daten zu handlungsfähigen Erkenntnissen“, sagte Justin Borgman, Chief Executive Officer von Starburst. „Gemeinsam treten wir als das Dell Data Lakehouse auf und sind bereit, das Landschaftsmanagement und die Datenanalyse neu zu definieren“.

Fünf Schlüsselversprechen des Dell Data Lakehouse

Wie wir im Oktober besprochen haben, umfasst unsere Vision für ein offenes, modernes Data Lakehouse wichtige Komponenten, um unseren Kunden dabei zu helfen, ihre größten Datenherausforderungen anzugehen. Das Dell Data Lakehouse hält fünf Schlüsselversprechen ein:

  1. Beseitigung von Datensilos. Verbessern Sie die Datenexploration mit sicheren, föderierten Abfragen, die von Starburst unterstützt werden, beschleunigen Sie die Einblicke um bis zu 90%[1] und enthüllen Sie Nutzungsverhalten, das eine intelligentere Zentralisierung von Daten in das Data Lakehouse ermöglicht.
  2. Leistung im großen Maßstab entfesseln. Mit einem verteilten, massiv parallelisierten Motor, der auf maßgeschneiderte Infrastruktur läuft, die Berechnung und Speicherung trennt, erreichen Sie eine beispiellose Leistung, die sich mit Ihren wachsenden Anforderungen skalieren lässt.
  3. Kontrolle über Ihre Daten übernehmen. 100% offenes Format und zukunftssicher mit modernen Branchenstandards wie Dateiformaten wie Parquet, Avro, ORC und Tabellenformaten wie Iceberg und Delta Lake. Die integrierte Datenverwaltung hilft Ihnen, die Kontrolle über Ihre Daten zu behalten und ermöglicht es Ihnen, sich in sich entwickelnden Landschaften mit Vertrauen und Klarheit zu bewegen.
  4. Erkenntnisse demokratisieren. Geben Sie Ihrem Datenteam selbstbedienenden Zugriff, damit sie hochwertige Datenprodukte erstellen können, die eine Kultur der Zusammenarbeit und Exploration fördern, um Ihr Unternehmen voranzubringen. Integrieren Sie sich in ein breites Ökosystem von Tools wie BI, KI und ML-Tools, um eine breitere Reichweite für Innovationen in der Organisation zu ermöglichen.
  5. Eine vereinfachte Plattform. Entwickelt, um Bereitstellung, Lebenszyklusmanagement und Support-Services zu optimieren, bietet diese schlüsselfertige Lösung, die Berechnung, Software und Speicherkomponenten umfasst, im Vergleich zu Cloud-basierten Optionen eine kostengünstige und vorhersehbare Ausgabe. Die Dell Data Analytics Engine ermöglicht eine 3x schnellere Einsicht bei halbem Kosten anderer vergleichbarer Technologien.[2] Die Dell ECS-Speicherung kann bis zu 76% der Gesamtbetriebskosten im Vergleich zu Angeboten in der öffentlichen Cloud einsparen.[3] Und schließlich kann die Dell Lakehouse-Systemsoftware erhebliche Betriebseinsparungen erzielen, indem sie den manuellen Aufwand über den gesamten Lebenszyklus hinweg reduziert.

Diese Technologie, zusammen mit Dell Services, hilft Organisationen, KI-Ergebnisse in jeder Phase zu beschleunigen. Nutzen Sie die Experten von Dell Technologies, die unter den Forbes 2023 World’s Best Management Consulting Firms genannt werden, um eine gewinnbringende Strategie auszurichten, Datensätze schnell zu validieren, Ihre Datenplattform zu implementieren und sichere, optimierte Operationen aufrechtzuerhalten.

Die nächste Generation der KI erfordert, dass Organisationen neue Architekturen für ihre Datenplattform übernehmen. Wir glauben, dass diese Plattform ein offenes, modernes Data Lakehouse sein sollte, das als hochsicherer, einziger Zugangspunkt zu allen Daten dient. Die leistungsstarke Kombination aus der Dell Data Analytics Engine mit Berechnung (PowerEdge), Objektspeicherung (ECS, ObjectScale und PowerScale) und professionellen Dienstleistungen gibt Organisationen die Möglichkeit, die Grundlage für eine leistungsstarke, skalierbare Datenplattform für das KI-Zeitalter zu schaffen.

Informieren Sie sich auf der NVIDIA GTC und der Dell Technologies World über das Dell Data Lakehouse.

Erfahren Sie mehr über die Komponenten der Lösung auf unserer Website[i]. Wenden Sie sich an Ihren Dell-Kundenbetreuer, um das Dell Data Lakehouse für Ihre Datenbedürfnisse zu erkunden.

[1] ESG Economic Validation. McAfee, Nathan. Apr 2022. “Analyzing the Economic Benefits of Starburst Enterprise”

[2] Cloud Data Warehouse vs. Cloud Data Lakehouse: A Snowflake vs. Starburst TCO and Performance Comparison, published by GigaOm

[3] ESG Economic Validation sponsored by Dell Technologies, “Analyzing the Economic Benefits of Dell ECS: Economic Benefit Analysis of On-premises Object Storage versus Public Cloud,” by Tony Palmer, July 2022. Cost savings based on ESG comparison of ECS to a leading public cloud in active storage scenarios.

About the Author: Greg Findlen

Greg is Senior Vice President of Product Management of Data Management at Dell Technologies. He is focused on efforts in the data management space to build solutions to enable customers better unlock the value from the data they generate each day across their organization. Prior to this role, he spent years leading engineering teams focused on developing products that scale across Dell’s enterprise portfolio of products, such as APEX, CloudIQ and others. Greg has over 25 years of experience in the technology industry and joined the company in 2006. Since joining Dell he has held a variety of positions across the Infrastructure Solutions Group and has led key functions including development, data analytics, pricing, business operations, program management and strategy development. Greg also served as a leader of the Dell and EMC integration which drove all key aspects of the merger planning related to the products and engineering teams. Prior to his time at Dell, he worked in the semiconductor test industry and drove quality improvement efforts, supplier relationships, and engaged across development and operations roles.