検証用マシンで、姫野ベンチを使ってベンチマークの結果を取ってみました。

 

姫野ベンチについては、こちらを参照してください。

 

 

並列に計算させるために、MPICHを採用しました。

MPICH2は、今度使ってみようと思いますw

 

 

今回使用したのは以下の通りとなっています。

 

 

■OS

CentOS 5.4 64bit

 

■検証用マシンスペック
・ProLiant ML110 G5
・CPU・・・Core 2 Quad 9550
・MEM・・・UMAX 2GBx4

 

■検証用マシンスペック
・ProLiant ML110 G5
・CPU・・・Core 2 Quad 9550
・MEM・・・UMAX 2GBx4

 

 

■並列計算ライブラリ

・mpich-1.2.7p1

 

 

■コンパイラ

gcc-4.1.2-46.el5_4.1

 

 

■姫野ベンチの計算に使用したサイズ

M

 

 

今回、色々と試してみました。

以下が結果です。

 

 

表1. CPUのコア数とX、Y、Z分割を変化させた時の結果

X

Y

Z

結果(MFLOPS)

差(%)

1

1

1

1308.320227

100

1

1

2

2734.830006

209

1

2

1

2416.873648

184

2

1

1

2422.409434

185

1

1

3

2654.017057

202

1

3

1

2685.225005

205

3

1

1

2660.013587

203

1

1

4

2811.810745

214

1

4

1

2983.174699

228

4

1

1

2947.166817

225

1

2

2

2979.811034

227

2

2

1

3048.252617

232

 

 

以下のグラフは、コア数を増やしていった時の最高値で比較したものです。

 

 

himeno

図1. コア数を増加させた時に出力された結果の最大値

 

コア数が3つの場合の時、すこし落ちてますね。

何故だろうww

 

コア数が1つの場合と、4つの場合の時では、約2.32倍ほど違いました。

 

色々とオーバーヘッドが出ていて、コア数が4つでも4倍の処理能力にはなりません。

 

でも、2.32倍か・・・。

 

もうちょっといけばよかったなぁw

 

ちょいと、メインマシンでも姫野ベンチを実行してみました。

メインマシンのスペックは以下の通りです。

 

■OS

Windows VISTA 32bit

 

 

■メインマシンのスペック

・CPU・・・Xeon 3350

・MEM・・・UMAX 1GBx2

 

 

■結果(1コア、サイズM)

1595.801 MFLOPS

 

 

9550の1コアより良い結果が出ちゃいました。

周波数は、9550の方が高いのに(´_ゝ`)

 

まぁ、マシンの環境が違いますから一概には言えませんが(‘~’)

 

あー、ネハーレンほしいし、デネーブもほしい。

 

しかし、今狙っているのは、来年発売予定のGulftown(グルフタウン?ガルフタウン?)ですね。

 

6コア、12スレッドなんてウヒョー(*゚∀゚)=3

 

補足

XLのサイズはメモリーが足りなくて出来ませんでした・・・orz

 

参考文献

http://www.mcs.anl.gov/research/projects/mpi/mpich1/

http://accc.riken.jp/hpc/HimenoBMT/index.html


11月 22, 2009 at 10:52 pm by 黒ぶちメガネ
Category: Linux