banner
ホームページ / ニュース / Intel Xeon「Sapphire Rapids」対AMD Ryzen Threadripper Pro
ニュース

Intel Xeon「Sapphire Rapids」対AMD Ryzen Threadripper Pro

Nov 27, 2023Nov 27, 2023

10 年前には、Intel が今日ワークステーション プロセッサで AMD に追いつくとは考えられませんでした。 しかし、AMD Ryzen Threadripper Proの圧倒的な成功と、Intelが2019年以来真のワークステーションクラスのプロセッサを発売できなかったことにより、私たちはまさにこの状況に陥りました。 Intel が成功するには、新しい「Sapphire Rapids」Xeon プロセッサ、具体的には Intel Xeon W-2400 および W-3400 を切実に必要としています。

チップ大手は確かにここで仕事を省略している。 AMD は Threadripper Pro によってワークステーション プロセッサの聖杯を実現し、膨大な数のコア (最大 64) を高いターボ周波数と高いメモリ帯域幅と組み合わせて、シングル スレッド CAD、マルチ スレッドなど、ワークフローのどこにいても印象的なパフォーマンスを提供します。 Threadripper Pro では、レンダリングやメモリ集中型のシミュレーションなど、ほぼすべての処理を実行できます。

当然のことながら、Intel は、最大 56 コア、最大 4.8 GHz ターボ、8 チャネル DDR5 メモリを備えた新しい「Sapphire Rapids」ワークステーション プロセッサにも同様の方針を採用しています。 アーキテクチャの面でも AMD を踏襲しています。 Threadripper Pro と同様、「Sapphire Rapids」プロセッサは、複数の小型チップが 1 つにパッケージ化された「チップレット」設計を特徴としています。 これは、すべてのコアが単一チップ上にある従来のモノリシック設計とは対照的であり、製造上の欠陥がより発生しやすく、したがって歩留まりが低下し、コストが高くなります。

Intel は AMD よりもワークステーションに重点を置いた幅広い製品範囲を持っており、Intel Xeon W-2400 および W-3400 シリーズ全体で合計 15 のモデルがあります (下の表を参照)。 対照的に、12、16、24、32、または 64 コアを搭載した「Zen 3」Ryzen Threadripper Pro 5000 WX シリーズ モデルは 6 つだけです。 いずれも 8 チャネル DDR4 3200 メモリを搭載しています。

Intel は、コア数とメモリ チャネルという 2 つの主な方法で Xeon W-2400 および Xeon W-3400 プロセッサ ファミリを区別しています。

Xeon W-2400 シリーズは、6 ~ 24 コアの 8 つのモデルと 4 チャネル DDR5 4800 メモリを備えた「メインストリーム」ワークステーション プロセッサとして分類されます。

一方、Intel Xeon W-3400 シリーズは、12 ~ 56 コアと 8 チャネル DDR5 4400/4800 メモリの 7 モデルを備えた「エキスパート」向けです。

新しいプロセッサーは完全に「Golden Cove」コアで構成されており、第 12 世代および第 13 世代インテル Core プロセッサーが先駆けたハイブリッド パフォーマンス コア (P コア) / エフィシェンシー コア (E コア) アーキテクチャは備えていません。

「Golden Cove」はインテルの最新の CPU アーキテクチャではありません。 これは、第 12 世代インテル コアの P コアの基礎を形成しました。

コア以外にも、2 つのプロセッサ ファミリ間にはいくつかの重要な違いがあります。 Intel Xeon W-2400 と比較して、Intel Xeon W-3400 はより多くのメモリ容量 (4 TB 対 2 TB)、より多くの PCIe レーン (112 対 64) (より多くのアドイン GPU をサポートできる)、より多くの Intel Smartキャッシュ (L3)、およびより高い最大ベース電力 (350W 対 225W)。

Xeon プロセッサーとしては初めて、特定のモデル (X サフィックスの付いたモデル) のロックが解除され、プロセッサーをオーバークロックできるようになりました。 インテル エクストリーム チューニング ユーティリティ (インテル XTU) を通じて、さまざまなチューニング機能を利用できます。

大手 OEM がオーバークロックの道を歩む可能性は非常に低いですが、このレベルの制御により、専門のワークステーション メーカーがプラットフォームからより多くのパフォーマンスを絞り出すことで差別化を図るための門が開かれる可能性があります。 ただし、これは将来のことになるかもしれません。 現在のところ、電力を大量に消費するプロセッサー用の既製のオールインワン (AIO) 水冷クーラーはありませんが、英国の企業 Armari は、自社の Intel Xeon W-3400 ラック ワークステーション用のカスタム水冷ソリューションを開発しました。 (記事下部の囲み枠を参照)。

Intel Xeon W-2400 シリーズの中で際立っているプロセッサは、高いコア数と最高のブースト周波数を組み合わせた Xeon w7-2495X および w7-2475X です。 ローエンド モデルは、特定の有限要素解析 (FEA) や、より高いメモリ帯域幅の恩恵を受ける他のシミュレーション ツールに適している可能性がありますが、必ずしも多数のコアを利用できるわけではありません。 また、GPU レンダリングなどのマルチ GPU ワークフロー用のプラットフォームも提供できます。

Intel Xeon W-3400 シリーズにも同様のパターンがあり、上位モデルは最大のコア数と最高のブースト周波数を備えています。 この範囲の最高は、1.9 GHz の基本周波数と 4.80 GHz の Turbo Boost Max 3.0 を備えた 56 コア Intel Xeon w9-3495X です。

Intel Xeon w5-3425 などのファミリーのローエンド CPU は、エンジニアリング シミュレーションに同様の潜在的な利点を提供し、さらに多くの GPU をサポートする可能性があります。 完全な仕様は上の表で確認できます。

一方、Xeon W-2400 および Xeon W-3400 は、PCIe Gen 5、DDR5 4400/4800 メモリ (Threadripper Pro の DDR4 3200 よりも多くのメモリ帯域幅を提供)、Intel WiFi 6E などの最新テクノロジーをサポートしています。

大多数のワークステーションはシングル ソケット、高コア数の Intel Xeon W-2400 および Xeon W-3400 シリーズに焦点を当てていますが、「Sapphire Rapids」はデュアル プロセッサ ワークステーションの終焉を告げるものではありません。

第 4 世代インテル Xeon スケーラブル プロセッサーは、主にサーバー用に設計されており、すでに HP と Lenovo からワークステーションに導入されています。 最上位モデルの Intel Xeon Platinum 8490H は、プロセッサあたり 60 コアを提供し、デュアル ソケット ワークステーションでなんと 120 コアを実現します。 ただし、主要な OEM の中で、このチップを搭載しているのは Lenovo ThinkStation PX だけであり (レビューをお読みください)、プロセッサあたり 17,000 ドルという価格のため、市場はある程度限られていました。 HP Z8 G5 には第 4 世代インテル Xeon スケーラブル プロセッサーも搭載されていますが、最大 32 コアのモデルのみです。

テストでは、Intel と AMD のトップエンド ワークステーション プロセッサ、つまり 56 コア Intel Xeon w9-3495X と 64 コア AMD Ryzen Threadripper Pro 5995WX に焦点を当てました。 デュアルソケット 60 コア Intel Xeon Platinum 8490H もテストしました。

当社のテストマシンの詳細は以下でご覧いただけます。 ただし、両方の Lenovo ワークステーションは量産前ユニットであるため、最終出荷マシンとは若干異なる可能性があることに注意してください。 たとえば、BIOS のアップデートによりパフォーマンスが向上する可能性があるため、テスト結果を福音として扱うべきではありません。

レノボ ThinkStation P7

レノボ ThinkStation PX

スキャン 3XS GWP-ME A1128T

率直に言って、Intel の「Sapphire Rapids」プロセッサは非常に電力を消費します。 Intel Xeon w9-3495X プロセッサと Intel Xeon Platinum 8490H プロセッサの基本電力はいずれも 350 W です。 しかし、これは話の一部にすぎません。

たとえば、Cinebench でレンダリングすると、ThinkStation P7 のソケットでは 530 W、ThinkStation PX のソケットでは 1,000 W が観察されました。 シングルコアでレンダリングする場合でも、Lenovo ThinkStation P7 は 305W の電力を消費しました。

Threadripper Pro 5995WX がそれほど優れているというわけではありません。 デフォルトの TDP が 280 W の場合、Scan 3XS GWP-ME A1128T ワークステーションは、64 コアすべてを備えた Cinebench でレンダリングするときにソケットで依然として 474 W を消費しました。

最後に、すべてのテストは「究極のパフォーマンス」の Windows 電源プランで行われており、将来の BIOS アップデートによって消費電力が異なる可能性があることに注意することが重要です。

私たちは 3 つのワークステーションすべてを、AEC や製品開発で使用されるさまざまな実際のアプリケーションでテストしました。 また、第 12 世代インテル Core (Core i9-12900K)、第 13 世代インテル Core (Core i9-13900K)、および「Zen 4」AMD Ryzen 7000 シリーズ (AMD Ryzen 7950X など) を含む、インテルと AMD の「コンシューマー」プロセッサーのパフォーマンス数値も比較しました。 )、ただし、すべてのベンチマークのデータはありませんでした。

コンピュータ支援設計

CAD は、Intel「Sapphire Rapids」や AMD Ryzen Threadripper Pro の主要なターゲット ワークフローではありません。 実際、Solidworks、Inventor、Revit などの基本的な設計ツールのみを使用する建築家、エンジニア、デザイナーは、ほぼ確実に、第 12 世代または第 13 世代 Intel Core プロセッサーまたは AMD Ryzen 7000 の方が優れたサービスを提供するでしょう (比較記事をお読みください)。

Intel と AMD のエントリーレベルの CPU ファミリは一般に、コア数とメモリ帯域幅が少なくなりますが、クロック速度とクロックあたりの命令数 (IPC) が高く、これらの主にシングル スレッドのアプリケーションにとって重要です。

しかし最近では、CAD は建築家、エンジニア、デザイナーが使用する多くのツールのうちの 1 つにすぎないことが多く、その中にはより多くのコアやより高いメモリ帯域幅を搭載することで恩恵を受けるものもあります。 したがって、「Sapphire Rapids」が CAD でどのように動作するかを理解することが重要です。

Solidworks 2022 を基準として使用しました。Solidworks 2022 は、大部分がシングル スレッドか軽いスレッドであるため、少数の CPU コアのみを使用する機械 CAD アプリケーションです。

予想通り、Intel Core i9-12900K、Intel Core i9-13900K、AMD Ryzen 7950X が明確にリードしていました。 コア数が少なく、ターボ周波数が高く、(Core i9-12900K は別として) IPC が向上しているため、Intel と AMD のハイエンド ワークステーション プロセッサではまったく追いつくことができません。

Xeon w9-3495X は、リビルド、変換、シミュレーションのテストにおいて、Threadripper Pro 5995WX に対して小さいながらも大幅なリードを示しました。 しかし、Xeon w9-3495X はすべてが独自に機能していたわけではなく、質量特性とブール演算のテストで遅れをとっていました。

純粋なシングルスレッドのパフォーマンスを把握するために、合成レンダリング テストを通じてではありますが、Cinebench ST ベンチマークも使用しました。 ここでは、Xeon w9-3495X が Threadripper Pro 5995WX に対して 22% という明確なリードを持っていました。 興味深いことに、インテル Xeon Platinum 8490H はターボ周波数が大幅に低いにもかかわらず、AMD プロセッサーにそれほど遅れをとっていませんでした。

リアリティモデリング

リアリティ モデリングは、AEC 分野でさらに普及してきています。 Agisoft Metashape 1.73 は、複数の高解像度写真からメッシュを生成する写真測量ツールです。 マルチスレッドですが、起動時に複数の CPU コアを使用します。 一部の GPU 処理も使用しますが、その程度ははるかに低いです。

米国のワークステーション専門メーカーである Puget Systems のベンチマークを使用してテストしました。 Threadripper Pro 5995WX は、小規模な Rock モデル テストでは Xeon w9-3495X をわずかに上回りましたが、大規模な学校マップ テストでは 13% 高速でした。 興味深いことに、Xeon Platinum 8490H はペースから大きく外れていました。 ソフトウェアが両方の CPU に負荷を分散しますが、これに対して最適化されていないのではないかと考えられます。 これを低い周波数だけで説明するのは困難です。

点群処理ソフトウェアである Leica Cyclone Register 360 は、システム メモリの量に応じてスレッドを割り当てます。 64 GB のマシンでは 5 つのスレッドで実行され、128 GB 以上のマシンでは 6 つのスレッドで実行されます。

Threadripper Pro 5995WX は、99 GB データセットを登録する際に Xeon w9-3495X よりも 10% 高速でした。 どちらの CPU も、AMD と Intel のコンシューマ プロセッサに比べて遅れをとっています。 これらのテスト マシンのメモリは 64 GB しかなく、5 つのスレッドでしか実行できませんでしたが、周波数と IPC が高いため、テスト マシンが優位に立つことができました。

レンダリング

レイ トレース レンダリングは拡張性が高くなります。 大まかに言えば、CPU コアの数を 2 倍にすると、レンダリング時間は半分になります (周波数が維持されている場合)。

Threadripper Pro 5995WX は、デザイン視覚化のための最も人気のある 2 つのツールである KeyShot と V-Ray、および Cinema4D のベンチマークである Cinebench 23 において、Xeon w9-3495X を大幅に上回りました。 Threadripper Pro 5995WX は、Keyshot で 35%、V-Ray で 27%、Cinebench で 20% 高速になりました。 これはかなりのリードです。

しかし、AMD のトップエンド ワークステーション プロセッサが Xeon w9-3495X に対して持つ利点は、コアが 8 個多いということだけではありません。 両方のプロセッサーの相対的なエネルギー効率、つまりそれらが維持できる全コア周波数は、パフォーマンスに大きな影響を与えます。

たとえば、Cinebench では、Threadripper Pro 5995WX はすべての 64 コアで 3.05 GHz を維持しましたが、Xeon w9-3495X は 2.54 GHz に低下しました。 Xeon w9-3495X の電力、周波数、スレッドの関係は、以下のグラフで詳しく見ることができます。

一方、デュアル Intel Xeon Platinum 8490H は、両方のシングル ソケット プロセッサを大幅に上回りました。 しかし、120 個のコアと 240 個のスレッドを使用できることを考えれば、それほど驚くべきことではありません。

エンジニアリングシミュレーション

エンジニアリング シミュレーションには、有限要素解析 (FEA) と数値流体力学 (CFD) が含まれます。 FEA は、製品が現実世界の力や温度にどのように反応するかを予測するのに役立ちます。 CFD を使用すると、自動車の空気力学を最適化したり、建物に対する風の影響を予測したりできます。 どちらのタイプのソフトウェアも、非常に高い計算能力を必要とします。

FEA と CFD で使用される「ソルバー」にはさまざまな種類があり、それぞれの動作は異なり、データセットも異なります。

一般に、CFD は拡張性に優れており、より多くの CPU コアを使用すると調査がより迅速に解決されるはずです。 重要なのは、CFD は各 CPU コアにデータをより速く供給できるため、メモリ帯域幅からも大きなメリットを得ることができます。 これは、「Sapphire Rapids」が Threadripper Pro を上回ることができる領域の 1 つです。 どちらも8チャンネルのメモリを搭載していますが、「Sapphire Rapids」はより高速なDDR5 4,800MHzを使用するのに対し、Threadripper ProはDDR4 3,200MHzを使用します。

テストでは、SPECworkstation 3.1 ベンチマークから選択した 3 つのワークロードを使用しました。 これには、2 つの CFD ベンチマーク (圧縮性流れを表す Rodinia、燃焼と乱流をモデル化する WPCcfd) と 1 つの FEA ベンチマーク (ジェット エンジンのタービンの内部温度をモデル化する CalculiX) が含まれます。

Rodinia では、Xeon w9-3495X が Threadripper Pro 5995WX を 101% も上回りました。 WPCcfd ではリードは小さくなりましたが、13% と依然として有意でした。 どちらのプロセッサーのパフォーマンスも、デュアル Intel Xeon Platinum 8490H に比べれば劣っています。

Calculix (FEA) テストでは、どちらの Intel プロセッサもはるかに悪い成績を収め、Threadripper Pro 5995WX が大幅にリードしました。

コアに加えて、メモリ帯域幅も、ワークステーション プロセッサと消費者向けプロセッサとの主な差別化要因の 1 つです。

これは主に、各プロセッサがサポートするメモリ チャネルの数によって決まりますが、メモリの種類によっても決まります。

メモリ チャネルは、システム メモリと CPU の間の経路として機能します。 CPU のチャネルが多いほど、より高速なデータを配信できます。

第 13 世代 Intel Core と AMD Ryzen 7000 シリーズには 2 つのメモリ チャネルがあり、Intel Xeon W-2400 シリーズには 4 つ、Intel Xeon W-3400 シリーズ、第 4 世代 Intel Xeon スケーラブル、および Threadripper Pro 5000 シリーズにはすべて 8 つのメモリ チャネルがあります。 すべてのメモリ帯域幅を取得するには、すべてのテスト マシンの場合と同様に、すべてのメモリ チャネルにメモリ モジュールを装着する必要があります。

前述したように、「Sapphire Rapids」Xeon は、DDR4 3,200MHz と比較してより高速なメモリ (DDR5 4,800MHz) をサポートするため、AMD Ryzen Threadripper 5000 シリーズよりも優れています。

SiSoft Sandra ベンチマークを簡単に実行すると、期待できるメモリ帯域幅の比較がわかります。 Threadripper Pro 5995WX は 139.27 GB/秒を記録し、インテル Xeon w9-3495X は 184.64 GB/秒、デュアル インテル Xeon Platinum 8490H は最大 325.6 GB/秒を記録しました。 これらの数字は、Sapphire Rapids がメモリ集中型の CFD ベンチマークで優れたパフォーマンスを示している理由を説明するのに役立ちます。

メモリ帯域幅がさまざまなワークフローでパフォーマンスにどのような影響を与えるかを確認するために、1 つの 32 GB DIMM を備えた 1 チャネルから、8 x 32 GB を備えた 8 チャネルまで、さまざまなメモリ構成で Xeon w9-3495X をテストしました。 DIMM。 興味深いことに、6 チャネルであっても、Xeon w9-3495X はメモリ帯域幅で Threadripper Pro 5995WX を上回り、SiSoft Sandra で 141.21 GB/秒を実現しました。

ほとんどのベンチマークは 32 GB のメモリに収まるため、完全に無視することはできませんが、容量を削減したという事実が結果に与える影響は最小限に抑えられます。 例外は、システム メモリに関連して使用されるコアの数を調整する Leica Cyclone Register 360 テストです。 これが、32 GB でパフォーマンスが大幅に低下する理由です。

以下のグラフからわかるように、WPCcfd ベンチマークのメモリ帯域幅はパフォーマンスに大きな影響を与えます。 興味深いことに、6 チャネルが埋まった場合でも、Intel Xeon w9-3495X は AMD Ryzen Threadripper Pro 5995WX よりも優れたパフォーマンスを示します。

メモリ帯域幅に大きく影響されるもう 1 つのワークフローは、使用可能なすべてのコアを使用する Unreal Engine 4.26 でのシェーダーの再コンパイルです。 ただし、Threadripper Pro 5995WX は GB/秒で劣っていますが、自動車用ベンチマークでは Xeon w9-3495X を上回ることができたため、コアと全コア周波数で補っています。

CAD (Solidworks)、レイ トレース レンダリング (V-Ray)、およびリアリティ モデリング (Leica Cyclone Register 360 および Agisoft MetaShape Professional 1.73) のパフォーマンスは、メモリ帯域幅の影響をほとんど受けないようです。 Solidworks にはいくつかの注意事項があります。 シミュレーション テストでは、4 チャネルから 1 チャネルに移行するとパフォーマンスが少し低下しました。 ブール演算では、1 チャネル メモリの方が実際にはわずかに良い結果をもたらしました。

インテルにとって、「Sapphire Rapids」Xeon W-2400 および Xeon W-3400 が成功することの重要性は、どれだけ強調してもしすぎることはありません。 ここ数年、AMD は多くのコアや高いメモリ帯域幅のメリットを享受できるワークフローにおいて、ほとんど競合をしてきませんでした。 Intel は Threadripper Pro の影響を確実に感じているでしょう。

しかし、私たちのテストによると、Sapphire Rapids は、少なくともより広範な AEC 分野において、私たちが考えていた Threadripper Pro 5000 WX シリーズのキラーにはならないでしょう。

レイ トレース レンダリングでは、64 コアの Threadripper Pro 5995X が、56 コアの Xeon w9-3495X に対して依然としてかなりのリードを持っています。 また、Intel は Xeon W-2400 および W-3400 ファミリ全体で非常に多くの異なるモデルを持っているという理由だけで、特定の価格帯で勝つ可能性はありますが、Viz の専門家が一斉に「Sapphire Rapids」に移行するとは確かに予想していません。 さらに、範囲が下に行くにつれて、第 13 世代 Intel Core との競争が激化します。

しかし、「Sapphire Rapids」にはいくつかの大きな利点があります。 シングルスレッドのワークフローでは Threadripper Pro よりも優れているようで、一部の CAD/BIM アプリケーションでは大きな違いを生む可能性があります。 シングルスレッドのパフォーマンスが向上すると、CPU に制限のあるアプリケーションの 3D フレーム レートも向上します。

「Sapphire Rapids」の潜在的な最大の利点は、エンジニアリング シミュレーション、特に CFD から得られます。 私たちのテストでは、「Sapphire Rapids」は主にその優れたメモリ帯域幅のおかげでパフォーマンスを大幅に向上できることがわかりました。 ソルバーやデータセットはさまざまですが、Ansys、Altair などのツールを真剣に使用しているユーザーは、Xeon W-3400 および第 4 世代インテル Xeon スケーラブル プロセッサーで何ができるかを検討する必要があります。 非常に複雑なシミュレーションの実行には数時間、場合によっては数日かかる場合があります。 この時間を半分に短縮できれば、プロジェクトに多大なメリットがもたらされる可能性があります。

どれもエキサイティングですが、今後の展開に目が離せません。 AMDは今年後半に次世代「Zen 4」Threadripper Pro CPUを発売する予定だ。 そして、96 コアと 12 チャネル メモリ (DDR5) の噂が現実になれば、Intel がリードしていたとしても長続きしない可能性があります。

下にスクロールしてここを読んで購読してください

特集

Lenovo ThinkStation P7 Lenovo ThinkStation PX Scan 3XS GWP-ME A1128T コンピュータ支援設計 リアリティ モデリング レンダリング エンジニアリング シミュレーション
お問い合わせを送信
送信