3月 « 2018 « ACS NEWS

2018 年 3 月 のアーカイブ

Xeon Gold Benchmark – ジョブ同時実行、3cars、car2car

2018 年 3 月 30 日 金曜日
1. Neon_Refinedモデル 複数ジョブ同時実行 (mpp単精度avx2版
   8CPU使用単独実行:450sec
8CPU*2ジョブ同時:468sec ~ 494sec
   4CPU使用単独実行 : 781sec
4CPU*4ジョブ同時 : 880sec ~ 915sec

2, Topcrunch "3vehcle Collision"




MPP単精度 8CPU : 5672sec, 16CPU : 3176sec
投稿されている結果は、古いものが多いので、どちらも同じプロセッサ数では最速。

3. Topcrunch "car2car"



MPP単精度 16CPU : 26140sec 時間がかかり過ぎるのでテストはこれだけ。
  やはり、16プロセッサでは最速。
  どちらも良い結果なので、久しぶり(2004年10月以来)に結果を投稿しよう!!
 以下、投稿画面。最後にSubmit で完了。


 Submitしてしばらく待っていると、



失敗。何度か試したが全部失敗。結果リストを圧縮してみたら、「受付不可」
 なので、TopCrunchサイトには上記結果登録できず、でした。

Xeon Gold LSDYNA(1)”B01_crash” 再度

2018 年 3 月 27 日 火曜日

前回の掲載方式がとても分かりにくかったので、再編集版です。

(1) MPP単精度
 Xeon6134 AVX512が最速でした。


(2) SMP単精度 AVX2版
  前回も書いた通り、i7-6900Kがほぼ最速。SMP用AVX512版は用意されていない。


(3) SMP単精度 AVX2.vs.SSE2
  SMP版ではWindows版でも、AVX2, SSE2が選択できる。
  常にAVX2がSSE2より高速。 AVX2が使えるCPUならSSE2版不要。


(4) Hybrid単精度版 - 16コア全使用
  Hybrid版の実行方法は、% mpirun -np x hydrid_dyna i=データ -np y
X=1, Y=MAXなら性能はSMP版に近づき、X=max, Y=1ならMPP版に近づく。
Hybrid版の性能が、MPP版を超すのは、X*Y>128 の場合らしいので、以下は参考。


以上より、結論は(前回と同じ)
Linux, Windows版ともに、AVX2が使えるならAVX2版を使うべき
AVX512は、遅くなる場合があるので様子見、クロックの低いCPUなら使用有り、かな。


 

Xeon Gold ベンチマーク (3) TopCrunch neon_refined_reviced モデル

2018 年 3 月 23 日 金曜日
LSDYNAのXeon Gold 6134プロセッサにおける次の性能測定3回目。
今回は、いつもベンチマークに使っている、Topcrunch Neonモデルの例です。



以前の結果はこちら。

今回は、全てMPP単精度版での測定結果。以前の数値だけの結果一覧よりも随分見易くなった
と自分で感心するのと、Core i7が結構速く、コストも低いので複数台でのMPP運用もありか。
Core i7はメモリが最大128GBしか積めないので陰解法には向かないかもしれない。

Xeon Gold LSDYNAベンチマーク(2)”B03_Implicit_Stress_Large”

2018 年 3 月 22 日 木曜日
LSDYNAのXeon Gold 6134プロセッサにおける次の性能測定結果を紹介します。
今回は、Implicitの静解析です。
テストデータ:WinSuite_Models/Benchmark/B03_Implicit_stress_large

LSDYNAバージョン:LSDYNA 10.1 MPP, SMP Implicit解析なので、全て倍精度使用

比較マシン
① Xeon 6134 16Core(3.2GHz), 192GB, SSD 800GB, CentOS7.4
② Core i7 6900K 8Core(3.2-3.7GHz), 64GB, HDD 4TB, CentOS7.2
    メモリ不足のため、MPP版は実行できず。
③ Xeon E5 2687w v4 24Core(3.0GHz), 512GB, SSD 1.2TB
(1) MPP版 6134-AVX2.vs.6134-AVX512.vs.E5-2687
  自分は、Excel等あまり得意ではなく、部下にグラフ描き等教えてもらっていたのたが、
前回から継続して色々触っている間に、驚くべき進歩をとげ、随分とかっこ良くなったぞ!!


   AVX512版に期待したが、AVX2とほぼ同じ、、、というか少し遅い結果。

(2) SMP-AVX2版 6134.vs.6900K.vs.E5-2687
i7-6900Kは、8コアしかないので、16CPUの結果はなし。
しかし、8CPUまでの結果では、i7-6900Kが最速となってしまった。
前回のベンチマークもそうだったが、SMP版を使うなら、Core-i7 の方が良さそう?



こうなると、Core i9-7900Xや、AMDの最速CPU Ryzen 1950X等も試してみたい、と思う。
予算が許せば、の範囲で。


Xeon Gold LSDYNAベンチマーク(1)”B01_crash”

2018 年 3 月 22 日 木曜日
LSDYNAのXeon Gold 6134プロセッサにおける性能測定結果を紹介します。
LSDYNAバージョン:LSDYNA 10.1 MPP, SMP, Hybrid 
テストデータは、Explicit 衝突解析なので、全て単精度版を使
テストデータ:WinSuite_Models/Benchmark/B01_crash


比較マシン
① Xeon 6134 16Core(3.2GHz), 192GB, SSD 800GB, CentOS7.4
② Core i7 6900K 8Core(3.2-3.7GHz), 64GB, HDD 4TB, CentOS7.2
③ Xeon E5 2687w v4 24Core(3.0GHz), 512GB, SSD 1.2TB


(1) MPP単精度 Xeon 6134 AVX512.vs.AVX2 - AVX512が高速
  
ANSOL T3Dや、他のLSDYNA例題ではAVX512の性能が発揮されなかったが、この問題では
  AVX512が最高速となった。とりあえず、効果があったので一安心。




(2) MPP単精度 Xeon 6134.vs.Core-i7 - Xeon 6134が高速
同じモジュールでの性能比較のため、どちらもAVX2版使用




(3) MPP単精度 Xeon 6134.vs.Xeon E5 2687 - Xeon 6134が高速




(4) Xeon 6134 MPP.vs.SMP - 当然MPP版が高速だが、SMPも最後まで性能向上



(5) SMP単精度 Xeon 6134 AVX2.vs.SSE2 - AVX2はSSE2より常に高速



(6) SMP単精度 Xeon 6134 AVX2.vs.i7 6900K AVX2 - 互角か?
実行中のCPU状況を調べた結果、( %sar -m CPU 1 : 全CPUの平均クロック )
    6134 - 3.2GHz
    6900K - 3.8GHz (ターボ+0.1GHz が全コアに効いた状態)
     本来、3.7GHzまでのはずだが、BIOS設定を少し触った記憶、、思い出した。
 
 何故SMP版だけが互角になるのかは不明、そういうものだと思っておくことにする。


(6) 今回の Xeon Goldとは関係ないが、SMP単精度 Xeon 2687w SSE2.vs.AVX2
最近Windows SMP版でもAVX2可能となったので測定結果掲載。AVX2効果有り。


(7) Xeon6134 Hybrid版 - SMP&MPP16も比較のため掲載
(グラフスケール違いに注意)
Hybrid版の実行方法は、% mpirun -np x hydrid_dyna i=データ -np y
X=1, Y=MAXなら性能はSMP版に近づき、X=max, Y=1ならMPP版に近づく。
Hybrid版の性能が、MPP版を超すのは、X*Y>128 の場合らしいので、以下は参考。



ここでの結論:Linux, Windows版ともに、AVX2が使えるならAVX2版を使うべき
AVX512は、遅くなる場合があるので様子見、クロックの低いCPUなら使用有り、かな。



Xeon Gold ANSOL T3D ベンチマーク AVX512β版

2018 年 3 月 20 日 火曜日
前回に引き続き、T3Dのベンチマーク結果です。
Xeon Gold 6134 では AVX512というベクトル演算機が使える。これを使うためには、
コンパイラで、"AVX512対応用オプション" を指定する必要がある、ということで、
ANSOL社に頼んでAVX512対応版を作ってもらいました。ただし、ANSOL社ではこの機能
が使えるマシンはなく、単に再コンパイルしたのみ、チューニング作業はしていない。
テストデータは、前回と同様 Windturbin_RollerBearingModel 使用。
スレッド数 4,8, 16 の場合での結果です。



AVX512版は、Rev336_base(通常配布版)よりも10%程度遅くなってしまいました。
原因としては、(多分です)
- 単純に再コンパイルしただけでは性能向上は望めない。
- Gold6134は、3.2GHz で動いている。AVX512が動作すると消費電力を抑えるために
 2GHz程度までクロックを落とす? らしい。
- 2GHz程度のCPUを選んでいれば性能向上したのかな??? とは思うが、解析計算用に
 クロックの低いモデルを選ぶ人はいないのではないか。

Xeon Gold – ANSOL T3D ベンチマーク Xeon Gold.vs.Xeon E5

2018 年 3 月 16 日 金曜日

 

遂にベンチマークデータが公開可能になりました。最初は、ANSOL T3Dの結果です。
CentOS7.4では、標準インストール? (かどうかは不明)で次のライブラリが不足します。
   libodbc.so.2
これは、以下で取得、インストールできました。
# yum install unixODBC
今回の比較対象は、以前紹介した E5-2687w v4
使用データは、Windturbin_RollerBearingModel

Xeon Gold 6134 : CentOS7.4, 実行は全てSSD使用の結果。Rev337 RHEL7.2版使用
Xeon E5 2687w : Windows 10 64bit.  SSD使用での結果
         (2017/02のデータなので、T3Dリビジョンは異なる)

E5-2687では、12コアあたりが最速で、増やしても遅くなる傾向でしたが、Gold 6134
では、最大コア数まで性能上昇。16コア使用では3倍以上の高速化となった。

 

XEON Scalable Processor 再設定

2018 年 3 月 16 日 金曜日

昨日何度もインストールを行ったが、LVMにより、SSD+HDD でひとつのドライブとして
しかインストールできない。SSDと、HDDの性能比を知りたいので絶対に別マウントして
使いたい。何度やっても、0.8TB(SSD)+6.0TB(HDD)=6.8TBのファイルシステムになる。

OSなしで買って、自分でインストールしていたら、多分ここであきらめたろう。
しかし、プレインストールでは、SSD、HDD別になっていたのだ。

まあ、いいかと諦めて、NVIDIAの設定に入ったら、nouveauドライバの削除でつまづいた。
画面が全く映らない。これで昨夜は帰宅。

NVIDIAとは関係ないが、帰宅後、ディスク構成のやり方に気付いた。
    「HDDを外した状態でCentOSをインストール」

再度新規インストール開始

とりあえず、SSDだけでCentOS7.4の構築ができた。一度シャットダウン。
次は、HDDの結線を戻して再起動、手動でHDDをマウントすれば良い。

#fdisk /dev/sdb  –  内容を見ただけ。パーティションは1つできていた。
#mkfs -t ext4 /dev/sdb1  – 初期化
#mkdir /home1
# mount /dev/sdb1 /home1

後は、/etc/fstabを編集して起動時にマウントするよう編集。ついでにNFSマウントも記述

残りは、NVIDIAドライバのインストールだ。予めQUADRO用ドライバをダウンロード
しておき、nouveau の無効化開始。ネット上にやりかたは沢山出ているので詳細は割愛。
後で分かったが以下に注意
 – nouveau 無効化は早い時期にCUIモードで行う
 – nouveauが無効になるとDisplayPortから出力されない。DSUBケーブルもつないでおく。

上記でやっと動くようになり、MPI等をインストールして性能測定を再開した。

ベンチマーク中に気付いた。Xeonは電気喰いまくるのでUPSをデカいヤツに交換

結論:Linuxは自分でインストールしないとね。プレインストールでも良いけど好みの設定
にするには、一度は自分でインストールするべきと思う。とにかく直って良かった。

 

 

XEON Scalable Processor ワークステーション

2018 年 3 月 15 日 木曜日

3月1日、1月に注文していた、新XEONワークステーションが届いた。

スペックはというと、

  CPU:16Core Xeon Gold 6134(8Core x2CPU )
  3.2GHz/TurboBoost 3.7GHz L3=24.75MB TDP130W
  マザーボード:intel C621Chipset (UNI-XW-621S)   
  メモリー:192GB (16GBx12) ECC Registered DDR4-2666 6-Channel   
  HDD1 BootDevice:SSD 800GB MTBF200万時間高耐久 intel MLC   
  HDD2:SATAIII 6TB エンタープライズ用高信頼性HDD 
  光学ドライブ:Blu-Rayドライブ BD-R/RE/ROM DVD±R/RW/DL 対応   ビデオコントローラー:NVIDIA Quadro P4000 8.0GB DisplayPort x4
  電源:1200W 静音 80PLUS PLATINUM認証電源 (UNIV Xeonワークステーション用)
  OS : CentOS 7.4

梱包から本体を取り出して組み立ては即完了した。

セットアップ中 – IBM PlatForm MPIインストール中

3月12日から何とか使えるようになり、LSDYNA, ANSOL T3D の性能測定開始。
Linuxを選んだのは、AVX512が使えるから。ANSOLもAVX512対応版を作ってもらった。
性能測定中

ANSOL, LSDYNA共、かなりいい結果が出てきたが、3月14日夕方、再起動できなくなる。
BIOSの設定等変更しても立ち上がらない。OS更新が原因か? 不明。

そういう訳で、3月15日、CentOS7.4をDVDから新規インストール中。
デフォルトでインストールしてみたが、気に入らないので、やり直し3回目。

 

 

 

 

佐賀県 佐賀市訪問

2018 年 3 月 10 日 土曜日

急遽佐賀に行く用事ができて、成田発春秋航空佐賀往復をゲットして出発。
機内写真 「ことりっぷ」とは小トリップのことかな? 何の意味だ??? 

往路で、ANA機とかなり接近したので、証拠写真撮影

春秋航空 成田ー佐賀は片道8,000円程度なので、お安く旅ができます。

佐賀空港、世界に誇る佐賀名物一覧、全部すぐにわかる、、、人は少ないかも。

市内探訪中、大隈さん発見したので記念撮影

佐賀市内の風景は想像通り。
駅前の西友が1F食料品以外は閉店してしまったのが、ちょっと不便だったかも。

 

久々の横浜 野毛

2018 年 3 月 3 日 土曜日

ワシントンHが予約できたので、久しぶりの野毛。
ここは、何件目だったかな???
久々の不健康ライフを満喫できた、ぞ。