jueves, 9 de marzo de 2017

Instalación Torque PBS (en un solo equipo) nodo maestro y nodo de procesamiento


1.- Instalar requerimientos de TORQUE en el equipo:

 apt-get install libxml2-dev libssl-dev gcc make g++ libboost-all-dev


2.- Descargar el software TORQUE en el servidor de frontend


3.-Descompactar y compilar TORQUE

root]# tar -xzvf torque-.tar.gz 
[root]# cd torque-/
[root]# ./configure
[root]# make
[root]# make install

4.- Agregar el script necesario para iniciar el demonio "trqauthd" automaticamente:

[root]# cp contrib/init.d/debian.trqauthd /etc/init.d/trqauthd
[root]# update-rc.d trqauthd defaults
[root]# echo /usr/local/lib > /etc/ld.so.conf.d/torque.conf
[root]# ldconfig
[root]# service trqauthd start

5.- Verificar que el nombre del servidor front-end esta incluido en el archivo "server_name"

[root]# echo > /var/spool/torque/server_name


6.- Inicializar la base de datos de la instalacion de TORQUE:

[root]# export PATH=/usr/local/bin/:/usr/local/sbin/:$PATH
[root]# ./torque.setup root

7.- Agregar los nodos de ejecucion al archivo "nodes" en este caso el mismo que "server_name"

vi /var/spool/torque/server_priv/nodes

8.- Agregar el script necesario para iniciar el demonio "pbs_server" , "pbs_sched" y el demonio "pbs_mom" automaticamente:

[root]# cp contrib/init.d/debian.pbs_server /etc/init.d/pbs_server
[root]# update-rc.d pbs_server defaults
[root]# service pbs_server restart

[root]# cp contrib/init.d/debian.pbs_sched /etc/init.d/pbs_sched
[root]# update-rc.d pbs_sched defaults
[root]# service pbs_sched restart

[root]# cp contrib/init.d/debian.pbs_mom /etc/init.d/pbs_mom
[root]# update-rc.d pbs_mom defaults
[root]# service pbs_mom restart


9.- Configurar colas de ejecución de acuerdo a necesidades con el comando "qmgr -c  ", Ejemplo:

create queue batch
set queue batch queue_type = Execution
set queue batch max_running = 24
set queue batch resources_max.nodect = 1
set queue batch enabled = True
set queue batch started = True


10.- Ante posibles errores verificar lo siguiente:

- Que estén ejecutándose los demonios: trqauthd , pbs_server, pbs_mom, pbs_sched

- Que se este utilizando como nombre de los nodos el hostname reportado por Sistema Operativo

Puede validarse lo anterior ejecutando el comando "hostname" desde la consola.

- Deshabilitar el firewall

En Debian-Ubuntu con el siguiente comando "ufw disable"

- Notas adicionales sobre errores comunes:

Using qmgr to remove a queue attribute:

qmgr -c "unset queue default_queue acl_users"

No hay comentarios: