Сегодня 29 мая, среда ГлавнаяНовостиО проектеЛичный кабинетПомощьКонтакты Сделать стартовойКарта сайтаНаписать администрации
Поиск по сайту
 
Ваше мнение
Какой рейтинг вас больше интересует?
 
 
 
 
 
Проголосовало: 7273
Кнопка
BlogRider.ru - Каталог блогов Рунета
получить код
Тимур Лукманов
Тимур Лукманов
Голосов: 2
Адрес блога: http://www.destructio.ru/
Добавлен: 2012-02-07 17:12:01
 

TORQUE

2011-11-27 22:42:00 (читать в оригинале)

Начальная настройка
TORQUE - открытая версия PBS (Portable Batch System) для организации распределенных вычислений. Исходники лежат на оффсайте. После сборки RPM с помощью приложенного .spec-файла, получится 5 готовых RPM-пакетов:
torque
torque-client
torque-devel
torque-scheduler
torque-server
На сервере нужно установить все, кроме torque-devel, а на остальные ноды кластера хватит самого torque + torque-client

После установки на сервере в автозапуске должны быть сервисы pbs_server, pbs_sched, а на каждой ноде (и сервере если он тоже будет в работе) единственный процесс pbs_mom
Рабочей директорией по умолчанию является /var/spool/torque/.

После установки нужно инициализировать сервер, что можно сделать командой
pbs_server -t create
Чтобы все ноды были видны с сервера, их заресолвленные имена должны быть вписаны в ./server_priv/nodes, а на каждой ноде в ./torque/mom_priv/config вписать строку $pbsserver имя_сервера


Проверить правильность установки нод можно командой
pbsnodes -a
завершить процесс можно командой
qterm -t quick
Простейший способ проверки работоспособности установленной системы:
echo "sleep 30" | qsub
Это задание провисит 30 секунд и сдохнет. Если задания висят в очереди и не хотят работать, то нужно проверить наличие запущенного pbs_sched и состояние сервера:
qmgr -c 'list server'
Нормальное рабочее состояние сервера это server_state = Active, если вместо Active там Idle, то нужно перезапустить pbs_server с параметром -a


Работа с очередями
Создание новой очереди и задание ключевых параметров:
qmgr -c "create queue batch queue_type=execution"
qmgr -c "set queue batch started=true"
qmgr -c "set queue batch enabled=true"
qmgr -c "set queue batch resources_default.nodes=1"
qmgr -c "set queue batch resources_default.walltime=3600"
Время указывается в секундах.

Установить очередь по умолчанию:
qmgr -c "set server default_queue=batch"

Установка заданий в очередь 
Ставить задания в очередь с помощью команды qsub:
qsub -l nodes=nodesnum -V -q queuename tg
-l указывает на количество запрашиваемых ресурсов, например nodes=3:ppn=4 потребует по 4 ядра на каждой из 3-х нод.
-V очень важный параметр, показывает что TORQUE следует использовать пользовательские переменные окружения, без нее он даже ~/bin не найдет.
-q это название очереди
tg это название специального скрипта, в простейшем виде выглядящего так:
#PBS -N test
#PBS -l nodes=1,walltime=999:00:00
#PBS -S /bin/sh
#
#cd to your execution directory first
cd $PBS_O_WORKDIR
program_name
-N название задания
-l параметры выделения ресурсов (используются если они не заданы явно в qsub)

Скорее всего, есть способы ставить задания в очередь и без промежуточных скриптов, но и с ними неплохо. Если qsub запускать без параметров, то будут использоваться параметры из tg, если их нет и там, то из свойств запускаемой очереди.

Управление заданиями
qstat -a просмотреть полный список заданий в очереди
qdel number удалить задание number из очереди (только для владельца задания и администраторов)
qdel all удалить все задания из очереди





 


Самый-самый блог
Блогер ЖЖ все стерпит
ЖЖ все стерпит
по сумме баллов (758) в категории «Истории»


Загрузка...Загрузка...
BlogRider.ru не имеет отношения к публикуемым в записях блогов материалам. Все записи
взяты из открытых общедоступных источников и являются собственностью их авторов.