独自アーキテクチャで飛躍的な高性能化を果たしたEPYC
2019年8月に第2世代がリリースされ、エンタープライズサーバー市場に大きなインパクトを与えた「AMD EPYCサーバー・プロセッサー(以下、EPYC)」シリーズ。1ソケットで2ソケット相当の能力を発揮し、第1世代に比べても性能が約2倍となったこの第2世代EPYCは、そのパフォーマンスの高さで大きな注目を集めた。
実際に、日経BPが実施した調査 (*)でも、以前は「安かろう悪かろう」のイメージが強かったのに対し、「コストパフォーマンスが良さそう」「採用を検討したい」というコメントが増えている。
( * ):日経クロステック Active リサーチ Special, 「あなたのイメージは? AMD CPU搭載サーバーに関する利用実態調査」, 2020年11-12月調査実施, n=112
このEPYCがさらに進化を遂げた。2021年3月15日に「第3世代AMD EPYC 7003シリーズ」が発表されたのだ。これはコードネーム「Milan(ミラン)」として開発が進められてきたもの。第1世代の「Naples(ナポリ)」、第2世代の「Rome(ローマ)」に引き続き、今回もイタリアの都市がコードネームとなった。
EPYCでまず注目したいのが、プロセッサーの中身を「メモリ/IOダイ」と「CPU(コンピュート)ダイ」に分割し、これらを異なる技術で製造した上で組み合わせるという、独自のアーキテクチャを採用している点である。例えば第2世代では、メモリ/IOダイを14ナノメートル、CPUダイは7ナノメートルの製造技術で製造。これによってすべてを同じ製造技術で作る「モノリシックダイ」に比べ、製造コストを抑えながら高いパフォーマンスを実現しているわけだ。
「この考え方は第3世代でも踏襲されています。ただし第2世代とは異なる点もあります。例えば8コアを搭載するCPUダイの場合、第2世代では16MBのレベル3(L3)キャッシュを共有する4コアが2セット搭載されるという形になっていました。これに対して3世代では、32MBのL3キャッシュを8コアで共有。L3キャッシュの使い方の自由度がさらに高まり、性能向上に寄与しています」と日本AMDの中村 正澄氏は語る(図1)。
なお第3世代EPYCは、8コア構成から64コア構成まで8種類のコア数、合計で15モデルがラインアップされている。このうちコア数の少ないモデルの中には、CPUダイに搭載するコア数を少なくし、熱密度を下げることで動作周波数を高めているものもある。「これによって処理速度を向上させるとともに、1コア当たりのL3キャッシュ容量も増やしているのです」と中村氏は説明する。
第2世代と「ソケットコンパチブル」なことも大きな特長
またEPYCではコンシューマー向けのAMD Ryzenと同様に、CPU内部のデータ転送などを行う内部バスとして「AMD Infinity Fabric」を採用しているが、これもさらなる進化を遂げている。具体的には、Infinity Fabricとメモリクロックを同期することで、メモリ性能をさらに高められるようになったのだ。
メモリチャンネル数に関しては、従来の8チャンネルに加え、6チャンネルもサポートしている。その理由について中村氏は「8チャンネルだけの場合には2TBの次が4TBになりますが、6チャンネルもサポートすることで3TBも選択可能になります。競合他社が6チャンネルをサポートしているため、多くのお客様が6チャンネル構成に慣れていることも配慮しました」と述べる。
このような進化に伴い、パフォーマンスも第2世代に比べて向上。一般的なアプリケーション処理で、最大25%の性能向上が期待できるという。
第2世代と同様にハードウエアによる暗号化機能を実装している点も、大きな特長だ。第3世代では、さらにこの機能がネストされた(入れ子になった)仮想化環境でも利用可能になった。SME、SEVについては、すでに複数のOSがこの機能をサポートしている。
加えて、もう1つ重要な点が、第2世代EPYCと「ソケットコンパチブル」であることだ。BIOSのアップデートはもちろん必要になるが、ハードウエア的にはそのまま既存サーバーに載せることができ、システム出荷までのハードルが低くなっているのである。
このような特長を生かし、いち早く第3世代EPYCに対応したサーバー製品を提供しているのが、デル・テクノロジーズだ。
「当社では既に2021年2月から、第3世代EPYCを搭載したサーバー製品の提供を開始。リリース済みのサーバー製品に対して、新たに第3世代EPYCを搭載した形で出荷しています」と、デル・テクノロジーズの岡野 家和氏は語る。
現在その対象となっているのは、Dell EMC PowerEdge R7525、R6525、C6525、R7515、R6515の5モデルだ(図2)。
EPYCの能力を引き出す工夫を凝らしたPowerEdge
これらは第2世代EPYC搭載のころから高く評価され、様々な領域で活用されてきた製品群だ。例えば1ソケット2UラックモデルであるPowerEdge R7515は、そのCPUコア数とディスクスピンドル数のバランス、そしてコンパクトな奥行寸法が評価され、1万人を超えるグループ会社全体のHadoopシステム基盤として活用されている。高密度サーバーのPowerEdge C6525は、東京大学 物性研究所がスーパーコンピュータの計算ノードとして1,680台採用。2ソケット1UラックモデルのPowerEdge R6525は、数多くのエンタープライズシステムに加え、サービスプロバイダでの採用も多いという。
「これらのサーバー製品にいち早く適用することで、業界屈指の第3世代AMD EPYC搭載サーバーラインアップを実現しています。なおこれらの最新世代サーバーでは、EPYCの能力を最大限に引き出せるよう、デル・テクノロジーズ独自の工夫も行っています」(岡野氏)
その工夫としてまず取り上げたいのが、最大64コアのEPYC搭載や、メモリやストレージのフル搭載構成にも対応できるよう、より効率的な排熱とデジタル信号処理を実現している点だ。搭載部品のレイアウトを最適化することで、エアフローをさらに向上させるとともに、PCIe信号経路の短縮が行われているのである。
「PERC (PowerEdge RAID Controller)最新世代」によって、NVMeにハードウエアRAIDを実装できる点も注目すべきポイントだ。PERC H755NはPowerEdgeサーバー用のNVMeアレイコントローラであり、サーバーのバックプレーンに直接装着できる点が大きな特長となっている。そのためPCIeスロットを消費しないのである。
またPowerEdgeサーバーではOSブートデバイスとして、M2.SSDが搭載されRAIDを組むことができる「BOSS (Boot Optimized Storage Solution)」が選択できるが、これも進化している。新バージョンの「BOSS-S2」ではホットプラグ対応となり、サーバー稼働中にラックの背面からアクセスしてメンテナンスすることも可能になったのである。これによってサーバーの可用性はさらに高まることになる。
リモート管理もさらに進化、AIに最適化された新製品も
これらに加え、「iDRAC (integrated Dell Remote Access Controller )」の存在も、デル・テクノロジーズ製品ならではの特長だといえる。これはエージェントレスでサーバーのリモート管理を実現するものであり、すべてのPowerEdgeサーバーに組み込まれている。いわばサーバーの中にある管理専用システムであり、デル・テクノロジーズが提供するOpenManage Enterpriseという無償ツールと連携することで、サーバーの稼働状況の監視やインベントリ管理、リモートでの運用管理作業が可能になる。サーバー自体とは個別のプロセッサーで動くため、サーバー障害時でも利用可能だ。
「iDRACでは以前からサーバーCPUやメモリ、NICなどの詳細な管理を行えていましたが、最新世代ではさらにGPUのインベントリ管理や熱・温度の可視化も可能になりました」と岡野氏は説明する。
前述の第3世代EPYC対応モデルはいずれもNVIDIAのGPUをサポートしており、その可視化は大きな意味を持つ。しかしこれら以上に大きいのが、新たに登場するEPYC ベースの最新のGPUサーバーだ。
その最新モデルとは、PowerEdge XE8545。4Uサイズの筐体に、NVIDIA A100 GPUを4基と、最大64コアの第3世代EPYCを搭載できるソケットを2基実装。最大128コア構成で動かすことができる。また筐体の奥行きが810mmとなっており、標準ラックに余裕で搭載できる点も大きな特長。
「この製品はマシンラーニングやディープラーニングに最適化するため、GPUだけではなく、CPUコア数、メモリ容量、ストレージのいずれにおいても一切の妥協を排した設計となっています。NVIDIA A100 の NVLink用モジュールはPCI Expressカードより発熱量も大きいので、GPUの温度や熱の監視がより重要になっています。当社サーバーに搭載されているiDRACでは、GPUも他のコンポーネントと同じ様に監視対象ですので、GPUごとの温度と電力消費がリアルタイムにGUIで可視化されます」(岡野氏)
そのためエアフローも、従来製品以上に配慮されていると岡野氏。標準的なラック環境でも問題なく、NVIDIA A100 80GBモデルを動かせるようになっていると説明する。
「お客様企業のイノベーション・エンジンへ」重要な役割を果たす存在に
このように第3世代EPYC搭載のサーバー製品は、サーバーに搭載可能なコア数が多く、第2世代からさらに進化することで、これまで以上のパフォーマンスを発揮できるようになっている。その結果、データ解析やAIといった高速処理が求められるシステムへの適用はもちろんのこと、サーバーラックのスペース削減で低コスト化する、といった用途でも活用しやすくなっている。
ここで気になるのが、コア数が増大することで、Windows Serverのようにコア数に比例したライセンス体系のソフトウエアでは、コストが増大するのではないかということだ。
「こうしたご懸念は『Windows Server 2019 EPYCサーバー用特別ライセンス』によって解消できます」と岡野氏は話す。これはマイクロソフトとAMD、デル・テクノロジーズが共同で行っている2021年6月末までの期間限定のキャンペーンで、ライセンス課金を1ソケット当たり32コアで「キャッピング」するもの。つまり1ソケットに48コアや64コアのEPYCを搭載した場合でも、これに対応するライセンス課金は32コア分として計算されるわけだ。「PowerEdgeであればコストを抑えながら、より多くのCPUコアを実装できます。これをぜひお客様のイノベーション・エンジンとして、ご活用していただきたい」(岡野氏)。
このように性能密度が高く、コストパフォーマンスにも優れたサーバーがあれば、オンプレミスシステムの基盤をさらに集約できるとともに、新たな領域での取り組みも行いやすくなるはずだ。またiDRAC9などを積極的に活用することで、運用管理負担も大幅に軽減できるだろう。第3世代EPYCサーバーと搭載したPowerEdgeは、これからDXをさらに加速させるエンジンとして、重要な役割を果たすことになりそうだ。
日経BP社の許可により、2021年3月23日~ 2021年4月19日掲載 の 日経 xTECH Special を再構成したものです。