12月 « 2018 « ACS NEWS

2018 年 12 月 のアーカイブ

MPPDYNA 複数マシンでの実行

2018 年 12 月 26 日 水曜日

自分の周辺には、MPPDYNAを複数台で実行すれば、性能向上しそうなマシンが2台ある。
これ(CentOS7.5)これ(CentOS7.2)
10年近く前なら、2台でサクッと実行できた記憶があるが、今の時代はそうはいかなくなった。
これら2台、導入時期が違うので、設定がバラバラ、、複数台での実行には色々な困難を克服
しなければならないようだ。
何だかんだと試して実行可能となったので、以下にその手順をメモします。

1、ssh を2台のマシンに通す。
  2台の距離は5メートル以上ある。設定変更の度にマシン間の行き来は大変。

2、NFSマウント
  どちらかのHDDをNFSマウントで両マシンから同じに見えるようにする。

3、ユーザID
  両方のマシンに共通のユーザIDを作成する。
  名前だけでなく、ユーザ番号、グループ番号、ホム、パスワード等全て同じ。

4、MPIのバージョンを揃える
  どちらもPlatForm MPIが入っていたが、インストール時期によりバージョンが違っていた。
  同じバージョンに統一。

5.Firewall
  両マシンで止めるのが一番簡単だが、問題ある場合は、IPV4が互いに通るように設定

6、ホスト名記述ファイル
  mpirun -hostfile ファイル の形式で実行するので、
        ホスト名1:CPU数
     ホスト名2:CPU数
  を記述したファイルを準備する。

7、MPPDYNA実行
  mppdyna -hostfile ファイル名 mppdyna i=入力データ memory=………
       で実行できるはずです。

昨日、上記を書く前に WordPressを更新したら、5.0という新しいバージョンになったは
良いが、”ブロックエディタ” という形式に変わり全く書けなくなってしまった。
新しいエディタに慣れるまで、しばしお休み? と思ったが Classic Editor というプラグイン
をダウンロードして有効化してこれまでと同じやり方でできるようになった。
ただし、2021年までのサポートらしいので、それまでにブロックエディタ練習するか! 

 

LSDYNA R11 Implicit解析 反復法ソルバデフォルト設定変更

2018 年 12 月 25 日 火曜日
LSDYNA R11から導入された ソルバタイプ 22 ~ 26 の反復解法ソルバについて。
反復回数、許容誤差などをデフォルト設定で実行すると、従来よりも高速で、特にMPP版では
非常に速い。速いのは良いのだが、多くの場合 ”結果が違う” 現象が多発した。反復回数
設定が少なく、誤差が甘いため、収束しきっていないためらしい。

このまま一般ユーザが使用するには危険なので、デフォルト設定を厳しくするように何度か
やりとりした結果、Implicitソルバ担当者から、

*CONTROL_IMPLICIT_SOLVER CARD 2 におけるデフォルト値変更
IPARM1 : 反復回数最大数を 500 → 10000
RPARM1 : 誤差絶対値を 1.0E-10 → 1.0E-12
RPARM2 : 誤差絶対値を 1.0E-04 → 1.0E-08
これらの変更は、R10 Dev133145, R11 Dev 133146から採用される。

という回答を貰いました。
テスト問題で試したところ、タイプ22~26を使った場合でもタイプ02直接解法と全く同じか、
ほぼ同じ結果を得ることができました。 
ただし、計算時間は最初の設定よりもとても長くっています。
MPP 16cpu タイプ02:153s
MPP 16cpu タイプ22:423s
( Xeon6134, MPP_Dev133256での結果)

直接解法よりも相当遅くなってしまったので、通常使う場合はタイプ02 だけで十分と思われます。

vim メモ

2018 年 12 月 15 日 土曜日
viを使っていて、久しぶりに「ファイル内文字列全て置換」やろうと思ったら思い出すので結構苦労した。

ファイル内の obj を 全て o に変更する方法は、

:g/obj/s//o/gp

他にも色々あるらしいが、自分はずーっとこれ。


Core i9-9900K 設定変更 

2018 年 12 月 7 日 金曜日
前回までの性能測定で分かったことは、コイツは超高速、一番だ!!



残念ながら、こっちは期待外れ。 人気がありすぎて入手困難らしいが理解できない。



最近は、BIOSまで戻らなくても、INtel Extreme Tuning という便利なツールがある。
これは、デフォルトの各コアのクロック設定。ここを変更して高速化できるか試してみよう。



前部 45Xまで下げたら、1% 高速。



ならばと42Xまで下げたら当然ながら遅くなった。
やはり正攻法で攻めたい。全部 50X 以上、つまりオーバークロックで試してみよう。



45X 設定よりも遅くなった。どうも、Power Limitが黄色くなるのが気になる。



これを解消するには、Trubo Boost Short Power Max値を上げればいいらしい。少し上げた。
そしてLSDYNA実行テスト。最初は5GHz超だが時間経過すると、4.76GHz に下がってしまう。



色々変更しても性能への影響少なく、デフォルト状態でかなりギリギリにチューニングされているか?
これ以上いじくって壊したくないのから諦めて、このまま使うことにしよう、、、、何故遅い???

Windows 10マシン更新 GeForce RTX 2080Ti性能測定

2018 年 12 月 7 日 金曜日
前回は、LSDYNAの例で性能比較を示した。今回は、ANSOL T3D Rev348 GPU対応β版での
性能測定結果を紹介します。
テストモデルは、いつものウインドタービンモデルサンプルデータ。
これまでと異なるのは、2ステップ計算せた、2ステップ目の計算時間を測定値として採用
しています。



ANSOL GPU計算注意点
1)ハード導入直後、ANSOL GPU計算オプションは動作しなかった。(エラーストップ)
  RTX 2080Ti を使うためには、CUDA 10.0以上に対応している必要がある。
 (動作しなかったバージョンは、CUDA 9.2対応版)
2)CUDA 10.0以上対応により、既存ハードのグラフィックドライバも CUDA10.0以上に
  対応(=最新版に更新)する必要がある。
  古いまま実行した場合、CPUのみ実行時よりも相当遅くなる。(エラーメッセージなし)

自分の周辺にあるマシンで使えそうなもの全て実行した結果を以下に示します。



今回導入した Win10マシンですが、GPU計算を行えば、どのマシンよりも高速なのは良いとして、
CPUのみ(i9-9900K) では最も遅いという結果、、、何か納得できないが、これが現実か!!。



Windows 10マシン更新 Core i9-9900K 性能測定

2018 年 12 月 6 日 木曜日
机上のWIndows10マシンが不調! と何回か書いてましたが、後継機は丁度良いタイミングで
最新CPU & GPU を導入することができました。
スペックは以下。 価格は、ねずみコンピュータ直売で本体+ソフトで税込 ¥528,000 位。 
CPU : Core i9-9900K 8core HyperThreadはOFF
メモリ : DDR4-2666 64GB(LED付!)
GPU : Geforce RTX 2080Ti (11GB)
SSD : 1TB NWM Express SSD
多分、ゲーム用マシンとしては、11月時点では最高にスペックではないかと思う。
ケースも片面強化ガラス仕様なので、外見的には完璧にゲーマ用マシンだ。



カバーを開けて、GPUカードを見てみる。



とりあえず、性能評価を実施して即ブログに掲載しようと思ったのだが、
- ANSOL GPU版が動作せず・・・・開発元のCUDAバージョン変更により使用可能となった。
- LSTC Implicit解析・・・・LSTC担当者とやりとりしている間に時間が過ぎ去る、、、

Core i9-9900K の性能測定
 LSDYNA 陽解法での比較。データはいつものNeon_Refinedモデル。
 
 
 結論を言うと、i9-9900K自体の性能は大したことはない。クロックを少し修正してみたが
 性能向上することはなかった。
 

 i7-6900Kより遅かったのは少しがっかりした。ただし、両者でOSが違うので、使用したモジュール
 のチューニングも異なっていると思われる。
i7-6900K : CentOS 7.2
i9-9900K : Windows10