IA, ML, HPC, comment le refroidissement liquide résout le défi de la densité dans le datacenter

La dernière génération de serveurs Dell PowerEdge propose pas moins de 12 plateformes adaptées au refroidissement liquide. Une approche qui s’avère de plus en plus nécessaire alors que les nouveaux processeurs pensés pour l’IA et le HPC promettent des records de densité et que les entreprises cherchent à réduire leur empreinte environnementale.
En partenariat avec 

La hausse de la densité énergétique au sein des racks met la ventilation sous pression. Le refroidissement par air dans les datacenters doit répondre à une demande de plus en plus grande. Les besoins croissants en puissance de calcul, entraînés par l’utilisation elle aussi grandissante de l’intelligence artificielle, du HPC ou d’autres workloads extrêmement gourmands en ressources, impliquent l’utilisation de puces toujours plus performantes et consommatrices d’énergie. Les infrastructures de dernière génération sont donc capables de traiter beaucoup plus de données, avec une empreinte au sol moindre et un rapport flops/watt en constante amélioration. Mais cela se traduit donc par une haute densité qui devient difficile à refroidir.

La puissance des processeurs et des accélérateurs devrait continuer de croître pour passer de 300 W à 1000 W, voire davantage. Le refroidissement par air a bien entendu évolué ces dernières années, avec le refroidissement multivecteur par exemple. Mais pour répondre à ces nouveaux besoins et anticiper ceux de demain, de nouvelles approches sont nécessaires. Le refroidissement liquide se positionne aujourd’hui comme une solution extrêmement pertinente pour conjuguer puissance de calcul, réduction des coûts et responsabilité environnementale.

Du propylène glycol en circuit fermé

Dell Technologies et Intel® avancent de concert dans cet objectif d’efficacité énergétique. Les processeurs Intel® Xeon Scalable de 4e génération, notamment le Xeon Platinum 8480+ ou le Xeon Platinum 8470N, intègrent un ensemble complet d’accélérateurs offrant performances et économies d’énergie. Ces accélérateurs, que l’on retrouve dans les derniers processeurs Intel® Xeon de 5e génération, permettent d’adresser une grande variété de charges de travail (IA, sécurité, stockage) avec des performances/watt jusqu’à 10 fois supérieures. ¹

Au niveau système, Dell Technologies collabore depuis de nombreuses années avec Intel® pour concevoir des infrastructures à haute densité et hautes performances s’appuyant sur le refroidissement liquide. En 2019 déjà, le serveur PowerEdge C6420 équipé de processeurs Intel® Xeon SP était doté d’un refroidissement liquide. À l’intérieur de ces serveurs, de petits échangeurs de chaleur, ou plaques froides, étaient montés au-dessus du processeur. Cette technologie est connue sous le nom de DLC (Direct Liquid Cooling).

Un fluide, mélange d’eau et de propylène glycol, est envoyé directement vers la plaque froide, où il capte la chaleur émise par le processeur. Le fluide devenu chaud est alors évacué vers un échangeur de chaleur, à l’intérieur du CDU (Cooling Distribution Unit, ou unité de distribution de liquide de refroidissement), au sein duquel le liquide est ramené à sa température initiale grâce à de l’eau froide, avant de commencer un nouveau cycle.

Il s’agit donc d’un circuit fermé qui amène en continu du liquide froid vers les puces et revient ensuite jusqu’à l’échangeur. Aucune eau n’est ainsi perdue ou consommée au cours du processus. Les plaques froides sont utilisées pour refroidir les composants les plus puissants du système, tels que les processeurs et les GPU, tandis que l’air est utilisé pour refroidir le reste de la machine.

Un nouveau cap avec les processeurs Intel® Data Center GPU Max

Ces dernières années, nous avons lancé davantage de plateformes proposant cette technologie de refroidissement liquide en option. Avec la dernière génération de serveurs PowerEdge, nous avons passé un nouveau cap, puisque 12 modèles supplémentaires proposaient le DLC. Ces plateformes permettent l’utilisation de processeurs innovants comme l’Intel®  Xeon 8470Q avec ses 52 cœurs et sa mémoire à large bande passante (HBM High Bandwidth Memory).

Un bon représentant de cette nouvelle gamme est le Dell PowerEdge XE9640 refroidi par DLC. Livré avec quatre processeurs Intel® Data Center GPU Max 1550, il constitue aujourd’hui l’une des plateformes les plus puissantes disponibles sur le marché pour les applications HPC et AI/ML. Bien que ces serveurs utilisent toujours de l’air pour refroidir les composants de faible puissance, le recours au refroidissement liquide nous a permis de regrouper quatre GPU et deux CPU dans un format 2U, tout en éliminant des centaines de watts de ventilation.

Et en plus de réduire la consommation énergétique du datacenter, le refroidissement liquide ouvre d’autres possibilités en matière de durabilité. La chaleur récupérée au niveau de l’échangeur peut être réutilisée pour chauffer des bâtiments adjacents par exemple. Dell Technologies et Intel® résolvent ainsi l’équation : puissance de calcul ET efficacité énergétique.

1 Basé sur des gains de performances par watt de 1,46x à 10,6x avec des accélérateurs intégrés sur une gamme de charges de travail d’IA, de bases de données et de réseau. Voir les revendications A19-A25, D1, D2, D5, N16 sur intel.com/processor : processeurs Intel Xeon Scalable de 5e génération. Les résultats peuvent varier.

About the Author: Sophie Pageaut

Sophie Pageaut est Field Marketing Manager France, EMEA Server Center of Competences.