LSDYNAのXeon Gold 6134プロセッサにおける性能測定結果を紹介します。
LSDYNAバージョン:LSDYNA 10.1 MPP, SMP, Hybrid
テストデータは、Explicit 衝突解析なので、全て単精度版を使
テストデータ:WinSuite_Models/Benchmark/B01_crash
比較マシン
① Xeon 6134 16Core(3.2GHz), 192GB, SSD 800GB, CentOS7.4
② Core i7 6900K 8Core(3.2-3.7GHz), 64GB, HDD 4TB, CentOS7.2
③ Xeon E5 2687w v4 24Core(3.0GHz), 512GB, SSD 1.2TB
(1) MPP単精度 Xeon 6134 AVX512.vs.AVX2 - AVX512が高速
ANSOL T3Dや、他のLSDYNA例題ではAVX512の性能が発揮されなかったが、この問題では
AVX512が最高速となった。とりあえず、効果があったので一安心。
(2) MPP単精度 Xeon 6134.vs.Core-i7 - Xeon 6134が高速
同じモジュールでの性能比較のため、どちらもAVX2版使用
(3) MPP単精度 Xeon 6134.vs.Xeon E5 2687 - Xeon 6134が高速
(4) Xeon 6134 MPP.vs.SMP - 当然MPP版が高速だが、SMPも最後まで性能向上
(5) SMP単精度 Xeon 6134 AVX2.vs.SSE2 - AVX2はSSE2より常に高速
(6) SMP単精度 Xeon 6134 AVX2.vs.i7 6900K AVX2 - 互角か?
実行中のCPU状況を調べた結果、( %sar -m CPU 1 : 全CPUの平均クロック )
6134 - 3.2GHz
6900K - 3.8GHz (ターボ+0.1GHz が全コアに効いた状態)
本来、3.7GHzまでのはずだが、BIOS設定を少し触った記憶、、思い出した。
何故SMP版だけが互角になるのかは不明、そういうものだと思っておくことにする。
(6) 今回の Xeon Goldとは関係ないが、SMP単精度 Xeon 2687w SSE2.vs.AVX2
最近Windows SMP版でもAVX2可能となったので測定結果掲載。AVX2効果有り。
(7) Xeon6134 Hybrid版 - SMP&MPP16も比較のため掲載(グラフスケール違いに注意)
Hybrid版の実行方法は、% mpirun -np x hydrid_dyna i=データ -np y
X=1, Y=MAXなら性能はSMP版に近づき、X=max, Y=1ならMPP版に近づく。
Hybrid版の性能が、MPP版を超すのは、X*Y>128 の場合らしいので、以下は参考。
ここでの結論:Linux, Windows版ともに、AVX2が使えるならAVX2版を使うべき。
AVX512は、遅くなる場合があるので様子見、クロックの低いCPUなら使用有り、かな。