Deep Dive zum flüssigkeitsgekühlten GPU-Server Dell PowerEdge XE9640


Der Dell PowerEdge XE9640 ist ein 4-fach GPU-beschleunigter Rackmount-Server, der dank Flüssigkeitskühlung KI-Leistung auf energieeffiziente Weise liefern kann. Der XE9640 wurde während angekündigt SC22 zusammen mit dem XE8640 und einem unserer Favoriten, dem 8-Wege-Gerät XE9680 GPU-Server. Heute ist der XE9640 allgemein verfügbar und wir befassen uns eingehend mit der zugrunde liegenden Hardware.

Der Dell PowerEdge XE9640 ist ein 4-fach GPU-beschleunigter Rackmount-Server, der dank Flüssigkeitskühlung KI-Leistung auf energieeffiziente Weise liefern kann. Der XE9640 wurde während angekündigt SC22 zusammen mit dem XE8640 und einem unserer Favoriten, dem 8-Wege-Gerät XE9680 GPU-Server. Heute ist der XE9640 allgemein verfügbar und wir befassen uns eingehend mit der zugrunde liegenden Hardware.

Dell PowerEdge XE9640

Dell GPU Accelerated Server-Familie

Die PowerEdge XE-Serverfamilie wurde speziell für komplexe KI- und HPC-Workloads entwickelt, die Leistung und Zuverlässigkeit erfordern. Diese Server sind so konzipiert, dass sie leistungsstark, erkenntnisorientiert und intelligent sind. Heute umfasst die XE-Serverfamilie die XE9680 (Haben wir schon erwähnt, dass es ein Favorit von Jordan war?), XE9640, XE8640 und XE8545. Allen diesen Servern ist gemeinsam, dass sie so konzipiert sind, dass sie eine Vielzahl von KI-Initiativen mit einer für den Kunden sinnvollen Kühloption unterstützen.

Produkte

Zweck Vorteile Anwendungsfälle
XE9680 Entwickelt, um Erkenntnisse mit KI-Beschleunigung zu verbessern, die für optimale Leistung und die schnellste Wertschöpfungszeit ausgelegt ist Nutzen Sie extreme Leistung für KI und HPC mit 8x NVIDIA H100 oder A100 Tensor Core SXM GPUs Große Sprachmodelle
Der intelligente luftgekühlte Betrieb (bis zu 35 °C) maximiert die Datenumwandlung in Ergebnisse Verarbeitung natürlicher Sprache
Der intelligente luftgekühlte Betrieb (bis zu 35 °C) maximiert die Datenumwandlung in Ergebnisse Große Empfehlungs-Engine-Schulung
Modellierung und Simulation
Digitale Zwillinge und Fertigung
XE9640 Speziell entwickelt, um KI-Initiativen in einem hochdichten 2U-Server mit intelligenter Flüssigkeitskühlung voranzutreiben Erzielen Sie bessere Ergebnisse für KI mit 4x NVIDIA H100 Tensor Core GPUs oder 4x Intel Data Center Max OAM GPUs Verarbeitung natürlicher Sprache
Intelligente flüssigkeitsgekühlte CPUs und GPUs maximieren die Leistung Große Empfehlungs-Engine-Schulung
Niedrigere Gesamtbetriebskosten durch optimierte Stromnutzungseffizienz Modellierung und Simulation
Künstliche Intelligenz, ML/DL-Training zur Objekterkennung
XE8640 Fördern Sie KI-, HPC- und Analyse-Workloads mit überragender Leistung Automatisieren Sie die Analyse zu Erkenntnissen mit 4x NVIDIA H100 GPUs für eine Vielzahl von Anwendungen Sprachmodelle mit mittlerem Datensatz
Luftgekühlt betreiben (bis zu 35 °C), um die Energieeffizienz zu erhöhen Verarbeitung natürlicher Sprache
Skalieren Sie den Betrieb mit intelligenten Erweiterungsoptionen Modellierung und Simulation
Künstliche Intelligenz, ML/DL-Training und Inferenz, Bilderkennung
XE8545 Mainstream-KI- und Grafikanwendungsleistung Steigern Sie die Trainings- und Inferenzleistung mit 4x NVIDIA A100 GPUs Modellierung und Simulation, einschließlich seismischer Analyse
Der luftgekühlte Betrieb (bis zu 35 °C) sorgt für einen effizienten Betrieb Künstliche Intelligenz, ML/DL-Training und Inferenz, Bilderkennung und Chatbot
Niedrigere Gesamtbetriebskosten mit einer ausgewogenen Leistung/Watt-Lösung

Dell PowerEdge XE9640 – GPU-Vielfalt und Flüssigkeitskühlung

Der PowerEdge XE9640 bietet dank einer engen Partnerschaft mit dem Partner CoolIT direkte Flüssigkeitskühlung (DLC) für GPUS und CPUs. Der Server verfügt über einige Lüfter, um sicherzustellen, dass DRAM, Speicher und PCIe-Erweiterungskarten ausreichend Luftzirkulation und Kühlung erhalten. Allerdings müssen diese Lüfter nicht mit maximaler Drehzahl laufen, was eine erhebliche Energieeinsparung ermöglicht.

Dell PowerEdge XE9640 – NVIDIA GPU-Fach

Der PowerEdge XE9640 bringt GPU-Vielfalt auf den Tisch und bietet die Wahl zwischen einem 4x NVIDIA NVLink verbunden H100 SXM5-GPU 700W Modul oder 4x Intel XeLink vernetzte Intel Data Center GPU Max 1550 600 W Open Compute Platform (OCP) Accelerator Module (OAM).

Dank Technologien wie NVIDIA NVLink und Intel Xelink kommunizieren diese GPUs nahtlos und bündeln ihren Speicher und ihre Kerne effektiv. Dies ist besonders vorteilhaft für die Verarbeitung speicherkohärenter Arbeitslasten wie Large Language Models (LLM). Aufgrund dieser Vielseitigkeit eignet es sich für eine Vielzahl von KI-Workloads. Die offensichtliche Frage lautet natürlich: „Was ist mit AMD Instinct?“ Dell evaluiert ständig die zusätzliche GPU-Unterstützung, bietet jedoch zum Start keine AMD-Lösung für diesen Server an.

Dell PowerEdge XE9640 – Intel GPU-Fach

Diese GPU-Vielfalt ermöglicht es Benutzern, den steigenden Anforderungen generativer KI, industrieller Simulationsmodellierung und modernster wissenschaftlicher Forschung gerecht zu werden. Beispielsweise wurden die Intel Data Center GPU Max-Beschleunigerfunktionen des PowerEdge XE9640 im Texas Advanced Computing Center (TACC) für ihre Zwecke genutzt Stampede3-Supercomputer.

Im Hinblick auf Dichte und Kühlung wurde der PowerEdge XE9640 so konzipiert, dass er den Platz im Rack effizient nutzt und gleichzeitig die Leistung steigert. Mit seinem kompakten 2RU-Profil bietet dieser Server eine beeindruckende GPU-Kapazität pro Rack und maximiert so den wertvollen Platz im Rechenzentrum. Durch den Einsatz von DLC übertrifft der PowerEdge XE9640 herkömmliche luftgekühlte Systeme in Bezug auf Effizienz und Kosteneffizienz.

Dell PowerEdge XE9640 – Der Rest der Hardware

Über „nur“ die GPUs hinaus ist die Technik der XE-Serie erstklassig. Wir haben gerade einen gepostet Videobewertung des XE9640 und XE8640. Das Video bietet hervorragende Details zum Design, vom Laufwerkszugriff und der Verlegung der DLC-Leitungen beim XE9640 bis hin zur GPU-Flüssigkeitskühlung mit geschlossenem Kreislauf beim XE8640 und dem Weg für zukünftige Verbesserungen auf allen XE-Servern. Es ist unten als Referenz eingebettet.



Wie beim XE9640 ermöglicht das Entfernen der Blende einen einfachen Zugriff auf NVMe-Laufwerke. Zwei Steckplätze auf der rechten Seite des Gehäuses unterstützen die NVMe Boot-Optimized Storage Subsystem (BOSS)-Laufwerke und umfassen HWRAID 1 über 2 x M.2 SSDs. Heutzutage wird der Primärspeicher über 4x U.2 Gen4 NVMe-Laufwerke bereitgestellt. Dies wird sich in einer zukünftigen Version dank einer Option für ein SSD-Fach zur Unterstützung von 8x E3.S Gen5 NVMe-Laufwerken verdoppeln. Die Plattform unterstützt kein HW-RAID für die U.2-NVMe-Schächte, obwohl die meisten es nicht benötigen. Viele dieser GPU-Boxen nutzen riesige Datensätze extern. Der lokale Speicher ist in diesem Fall nicht die primäre Quelle für diese großen Datensätze.

Natürlich gibt es auf der Rückseite des Servers gute Erweiterungsmöglichkeiten für KI-Profis, die auf riesige Speicher-Arrays zugreifen müssen. Der XE9640 unterstützt vier PCIe Gen5-Steckplätze, zwei mit halber Höhe und zwei mit voller Höhe. Darüber hinaus verfügen Sie über einen PCIe Gen3 OCP-NIC-Steckplatz.

Dell PowerEdge XE9640 Vorderseite

Um die Angst vor einem Leck zu zerstreuen, verfügen flüssigkeitsgekühlte Server über Leckerkennungsberichte in iDRAC. Die Methode von Dell, Lecks zu erkennen, ist ziemlich unglaublich, wenn man in verschiedene Teile des Gehäuses bohrt. In der Aufnahme der CPU-Kühlplatte unten können Sie beispielsweise feine Kupferspuren in einem geschwungenen Muster rund um den gesamten Wasserblock erkennen. Wenn Wasser auf diese Anschlüsse tropft, erkennt die offene Verkabelungsschleife einen kleinen Kurzschluss und das System erkennt, dass ein Leck aufgetreten ist. In anderen Teilen des Fahrgestells werden geflochtene Drahtseile mit einer ähnlichen Erkennungsmethode verwendet. Dies ist auf unserem Foto des Hauptflüssigkeitsverteilerblocks mit den zahlreichen Schläuchen an der Vorderseite des Chassis zu sehen. Darüber hinaus verfügen die CoolIT-CDUs und der Rest des Kreislaufs an vielen Stellen auf dem Weg über Leckerkennungsberichte.

Dell PowerEdge XE9640 Leckerkennung

Übrigens verfügen die luftgekühlten Modelle XE8640 und XE9680 auch über eine GPU-Flüssigkeitskühlung mit geschlossenem Kreislauf und derselben Leckerkennung durch iDRAC.

Optimierung der Leistung pro Rack

Der PowerEdge XE9640 bietet Kunden die Möglichkeit, ihre Stromauslastung pro Rack genau abzustimmen. Bei neun Servern pro Rack könnte eine Spitzenlast beschleunigter Rechenleistung etwa 41 kW Leistung erfordern, wobei eine dreiphasige Stromverteilung für eine ausgewogene Leistung verwendet wird. Zur Skalierung können Rechenzentren Racks mit 12, 18 oder sogar 21 PowerEdge XE9640-Servern bereitstellen und so Leistungswerte von etwa 54 kW, 81 kW bzw. 95 kW erreichen. Diese Anpassungsfähigkeit ermöglicht es Rechenzentren, ihren Rack-Stromverbrauch entsprechend spezifischer Anforderungen zu optimieren.

Dell PowerEdge XE9640 Innen-Flüssigkeitskühlungsverteiler

Dell hat verschiedene Ressourcen zusammengestellt, um Kunden einen umfassenden Einblick in den PowerEdge XE9640 zu bieten. Dazu gehören Unboxing-Videos und detaillierte Produktbewertungen. Das Unboxing-Video stellt das Design und die Funktionen des Servers vor und bietet Kunden einen visuellen Überblick über seine Fähigkeiten.

Um die Vorteile des PowerEdge XE9640 noch weiter hervorzuheben, hat Dell eine Infografik erstellt, die ihn mit seinem luftgekühlten Gegenstück vergleicht PowerEdge XE8640. Diese Infografik hebt die bemerkenswerten Unterschiede des PowerEdge XE9640 hervor, insbesondere seine Effizienz bei der Flüssigkeitskühlung und die beeindruckende GPU-Kapazität pro Rack.

Dell PowerEdge XE9640 Rückseite

Abschließende Gedanken

Der PowerEdge XE9640 ist ein integraler Bestandteil der wachsenden generativen KI-Lösungen von Dell, die darauf ausgelegt sind, KI-Workloads zu revolutionieren und Innovationen zu fördern. Die generative KI-Lösung von Dell kombiniert modernste Technologie, Innovation und Dienste von Dell Technologies, um intelligentere und schnellere Ergebnisse zu liefern. Durch die Nutzung der Möglichkeiten generativer KI können Unternehmen neue Erkenntnisse gewinnen, ihre Transformationsbemühungen beschleunigen und die Effizienz ihrer Belegschaft steigern.

Während der XE9680 nach wie vor unser Favorit unter den GPU-Servern von Dell bleibt, hat sich der XE9640 allein aus der Effizienz- und Designperspektive seinen Weg in unsere Herzen erobert. Das 2U-Gehäuse bringt eine enorme Menge an Technik mit sich; Rechenzentren mit Flüssigkeitskühlung werden sich eindeutig für diese energieeffizienten Boxen entscheiden. Die vier NVIDIA-Module benötigen für sich selbst 2800 W. Daher ist alles, was Dell tun kann, um Rechenzentren dabei zu unterstützen, Rack- und energieeffizienter zu werden, ein riesiger Fortschritt.

Infografik

Beteiligen Sie sich an StorageReview

Newsletter | Youtube | Podcast iTunes/Spotify | Instagram | Twitter | Tick ​​Tack | RSS-Feed



Source link

Loading...