前回の掲載方式がとても分かりにくかったので、再編集版です。
(1) MPP単精度
Xeon6134 AVX512が最速でした。
(2) SMP単精度 AVX2版
前回も書いた通り、i7-6900Kがほぼ最速。SMP用AVX512版は用意されていない。
(3) SMP単精度 AVX2.vs.SSE2
SMP版ではWindows版でも、AVX2, SSE2が選択できる。
常にAVX2がSSE2より高速。 AVX2が使えるCPUならSSE2版不要。
(4) Hybrid単精度版 - 16コア全使用
Hybrid版の実行方法は、% mpirun -np x hydrid_dyna i=データ -np y
X=1, Y=MAXなら性能はSMP版に近づき、X=max, Y=1ならMPP版に近づく。
Hybrid版の性能が、MPP版を超すのは、X*Y>128 の場合らしいので、以下は参考。
以上より、結論は(前回と同じ)
Linux, Windows版ともに、AVX2が使えるならAVX2版を使うべき。
AVX512は、遅くなる場合があるので様子見、クロックの低いCPUなら使用有り、かな。