Memo - local Diff
- Added parts are displayed like this.
- Deleted parts are displayed
like this.
= saturn
== インストールしたもの
=== 自分のディレクトリの中
* netcdf-4.0.1
* fftw-3.2.2
== リンク
実行時にないと言われたので、勝手にリンク。
ln -s /opt/intel/Compiler/11.0/069/bin/ia32/libimf.so /usr/lib/libimf.so
ln -s /opt/intel/Compiler/11.0/069/bin/ia32/libiomp5.so /usr/lib/libiomp5.so
== ifort オプション比較
一番早いのは -fast -parallel だが、parallel にして全coreを使ってもわずか2%程度しか高速化しない。よって、1 core しか使わずにかなり速い -fast が一番効率的。グリッド数が増えれば parallel によって高速化する傾向はあるかもしれない。
# RT
, 100^2 (t=1.0) , , 200^2 (t=0.2),
, user, real, user, real
-O3, 28.536, 27.084, 47.115, 44.081
-fast, 24.482, 23.066, 41.506, 38.404
-O3 -parallel, 25.254, 1.20.503, 41.229, 2.07.016
-fast -parallel, 24.445, 1.14.408, 39.398, 1.58.302
== インストールしたもの
=== 自分のディレクトリの中
* netcdf-4.0.1
* fftw-3.2.2
== リンク
実行時にないと言われたので、勝手にリンク。
ln -s /opt/intel/Compiler/11.0/069/bin/ia32/libimf.so /usr/lib/libimf.so
ln -s /opt/intel/Compiler/11.0/069/bin/ia32/libiomp5.so /usr/lib/libiomp5.so
== ifort オプション比較
一番早いのは -fast -parallel だが、parallel にして全coreを使ってもわずか2%程度しか高速化しない。よって、1 core しか使わずにかなり速い -fast が一番効率的。グリッド数が増えれば parallel によって高速化する傾向はあるかもしれない。
# RT
, 100^2 (t=1.0) , , 200^2 (t=0.2),
, user, real, user, real
-O3, 28.536, 27.084, 47.115, 44.081
-fast, 24.482, 23.066, 41.506, 38.404
-O3 -parallel, 25.254, 1.20.503, 41.229, 2.07.016
-fast -parallel, 24.445, 1.14.408, 39.398, 1.58.302