OpenPBS最終確認、実行


「OpenPBS」の最終確認と実行方法です。

(1)管理サーバで計算に使用するノードファイルを再確認する。
[root@kanri ~]# cat /var/spool/pbs/server_priv/nodes
node1 np=1
node2 np=2

npオプション:ノードが搭載しているCPU(コア)の数を指定

(2)管理サーバの「OpenPBS」を再起動する。(念のため)
[root@kanri ~]# /etc/rc.d/init.d/pbs restart
Restarting PBS
Shutting down PBS:
Stopping pbs_server:                                       [  OK  ]
Stopping pbs_sched:                                        [  OK  ]
Starting PBS daemons:
Starging pbs_sched:                                        [  OK  ]
Starting pbs_server:                                       [  OK  ]

(3)管理サーバが計算ノードを認識しているか確認する。
[root@kanri ~]# /usr/local/pbs/bin/pbsnodes -a
node1
     state = free
     np = 1
     ntype = cluster

node2
     state = free
     np = 2
     ntype = cluster

stateがfreeになっていれば問題ないです。
もし、計算ノードの「OpenPBS(pbs_mom)」が起動していにも関わらずdownなどになっている場合は設定を見直してください。

(4)「OpenPBS」にジョブを投入する。
ここでは、「姫野ベンチ」を使用します。「OpenPBS」に投入するシェルスクリプトを作成する。
[mpi@kanri ~]$ vi test.sh
#!/bin/sh
#PBS -e /home/mpi/ER
#PBS -o /home/mpi/OU
#PBS -l ncpus=2
#PBS -l nodes=2

MPI=/usr/local/mpich

cd /home/mpi/cc_himenoBMTxp_mpi
source paramset.sh M 1 1 2
$MPI/bin/mpicc himenoBMTxps.c
$MPI/bin/mpirun -np 2 -machinefile $PBS_NODEFILE a.out

#PBS -e:エラーファイル出力先を指定
#PBS -o:結果ファイル出力先を指定
#PBS -l ncpus:計算に使用するCPU数を指定
#PBS -l nodes:計算に使用するノード数を指定
$PBS_NODEFILE:OpenPBSが自動的に割り当ててくれるノードファイルを指定

その他オプション

PBS -N [name] ジョブの名前が任意で決められる
PBS -l [nodes=n:ppn=α] 使用するノード数を指定する ppnはそのノードで使うCPU(コア)数を師弟する
PBS -l walltime=h/m/s このジョブの実行時間を指定する 指定時間は、時:分:秒である
PBS -q [queuename] 使用するキューを指定する

ジョブを投入する。
[mpi@kanri ~]$ /usr/local/pbs/bin/qsub test.sh
0.kanri.local

「queue」ステータスを見る方法。

・その1
[mpi@kanri ~]$ /usr/local/pbs/bin/qstat -q
 server: kanri.local

Queue            Memory CPU Time Walltime Node Run Que Lm  State
---------------- ------ -------- -------- ---- --- --- --  -----
tqueue             --      --       --     --    1   0 --   E R
                                               --- ---
                                                 1   0

・その2
[mpi@kanri ~]$ /usr/local/pbs/bin/qstat -Q
Queue            Max Tot Ena Str Que Run Hld Wat Trn Ext Type
---------------- --- --- --- --- --- --- --- --- --- --- ----------
tqueue             0   1 yes yes   0   1   0   0   0   0 Execution
qstat -q システムの全てのqueueを表示
qstat -B PBS Serverのサマリー情報を表示
qstat -a システムの全てのジョブを表示
qstat -Q 全てのqueueのリミット値を表示
qstat -s 全てのジョブをステータスコメント付きで表示
qstat -r 実行中の全てのジョブを表示
qstat -f [jobid] 指定したジョブの詳細な情報を表示
qstat -Qf [queue] 指定したキューの詳細な情報を表示

Comments are closed.