Torque最終確認、実行


「Torque」の最終確認と実行方法です。

(1)管理サーバで計算に使用するノードファイルを再確認する。
[root@kanri ~]# vi /var/spool/torque/server_priv/nodes
node1 np=1
node2 np=1

npオプション:ノードが搭載しているCPU(コア)の数を指定

(2)管理サーバの「Torque」を再起動する。(念のため)
[root@kanri ~]# /etc/rc.d/init.d/torque restart
Restarting PBS
Shutting down PBS:
Stopping pbs_server:                                       [  OK  ]
Stopping pbs_sched:                                        [  OK  ]
Starting PBS daemons:
Starging pbs_sched:                                        [  OK  ]
Starting pbs_server:                                       [  OK  ]
done.

(3)管理サーバが計算ノードを認識しているか確認する。
[root@kanri ~]# /usr/local/torque/bin/pbsnodes -a
node1
     state = free
     np = 1
     ntype = cluster
     status = opsys=linux,uname=Linux node1.local 2.6.18-164.15.1.el5 #1 SMP Wed Mar 17 11:37:14 EDT 2010 i686,
sessions=? 15201,nsessions=? 15201,nusers=0,idletime=26682,totmem=3132276kb,availmem=306910
8kb,physmem=1035132kb,
ncpus=1,loadave=0.00,netload=82966953,state=free,jobs=,varattr
=,rectime=1273409891

node2
     state = free
     np = 2
     ntype = cluster
     status = opsys=linux,uname=Linux node2.local 2.6.18-164.15.1.el5 #1 SMP Wed Mar 17 11:37:14 EDT 2010 i686,
sessions=? 0,nsessions=? 0,nusers=0,idletime=26650,totmem=3132276kb,availmem=3068920kb,
physmem=1035132kb,
ncpus=1,loadave=0.00,netload=75202289,state=free,jobs=,varattr
=,rectime=1273409891

stateがfreeになっていれば問題ないです。
もし、計算ノードの「Torque(pbs_mom)」が起動しているにも関わらずdownになっている場合は設定を見直してください。

(4)「Torque」にジョブを投入する。投入方法、確認方法は以下のURL(4)を参照のこと
http://www.kurobuti.com/linux_server/?page_id=243

Comments are closed.