Xeon Gold LSDYNAベンチマーク(1)”B01_crash” « ACS NEWS

Xeon Gold LSDYNAベンチマーク(1)”B01_crash”

2018 年 3 月 22 日 by yo yamgatta
LSDYNAのXeon Gold 6134プロセッサにおける性能測定結果を紹介します。
LSDYNAバージョン:LSDYNA 10.1 MPP, SMP, Hybrid 
テストデータは、Explicit 衝突解析なので、全て単精度版を使
テストデータ:WinSuite_Models/Benchmark/B01_crash


比較マシン
① Xeon 6134 16Core(3.2GHz), 192GB, SSD 800GB, CentOS7.4
② Core i7 6900K 8Core(3.2-3.7GHz), 64GB, HDD 4TB, CentOS7.2
③ Xeon E5 2687w v4 24Core(3.0GHz), 512GB, SSD 1.2TB


(1) MPP単精度 Xeon 6134 AVX512.vs.AVX2 - AVX512が高速
  
ANSOL T3Dや、他のLSDYNA例題ではAVX512の性能が発揮されなかったが、この問題では
  AVX512が最高速となった。とりあえず、効果があったので一安心。




(2) MPP単精度 Xeon 6134.vs.Core-i7 - Xeon 6134が高速
同じモジュールでの性能比較のため、どちらもAVX2版使用




(3) MPP単精度 Xeon 6134.vs.Xeon E5 2687 - Xeon 6134が高速




(4) Xeon 6134 MPP.vs.SMP - 当然MPP版が高速だが、SMPも最後まで性能向上



(5) SMP単精度 Xeon 6134 AVX2.vs.SSE2 - AVX2はSSE2より常に高速



(6) SMP単精度 Xeon 6134 AVX2.vs.i7 6900K AVX2 - 互角か?
実行中のCPU状況を調べた結果、( %sar -m CPU 1 : 全CPUの平均クロック )
    6134 - 3.2GHz
    6900K - 3.8GHz (ターボ+0.1GHz が全コアに効いた状態)
     本来、3.7GHzまでのはずだが、BIOS設定を少し触った記憶、、思い出した。
 
 何故SMP版だけが互角になるのかは不明、そういうものだと思っておくことにする。


(6) 今回の Xeon Goldとは関係ないが、SMP単精度 Xeon 2687w SSE2.vs.AVX2
最近Windows SMP版でもAVX2可能となったので測定結果掲載。AVX2効果有り。


(7) Xeon6134 Hybrid版 - SMP&MPP16も比較のため掲載
(グラフスケール違いに注意)
Hybrid版の実行方法は、% mpirun -np x hydrid_dyna i=データ -np y
X=1, Y=MAXなら性能はSMP版に近づき、X=max, Y=1ならMPP版に近づく。
Hybrid版の性能が、MPP版を超すのは、X*Y>128 の場合らしいので、以下は参考。



ここでの結論:Linux, Windows版ともに、AVX2が使えるならAVX2版を使うべき
AVX512は、遅くなる場合があるので様子見、クロックの低いCPUなら使用有り、かな。



コメントをどうぞ

*