![]() ![]() ![]()
Какой рейтинг вас больше интересует?
|
![]()
TORQUE2011-11-27 22:42:00 (читать в оригинале)
Начальная настройка
TORQUE - открытая версия PBS (Portable Batch System) для организации распределенных вычислений. Исходники лежат на оффсайте. После сборки RPM с помощью приложенного .spec-файла, получится 5 готовых RPM-пакетов: torqueНа сервере нужно установить все, кроме torque-devel, а на остальные ноды кластера хватит самого torque + torque-client
После установки на сервере в автозапуске должны быть сервисы pbs_server, pbs_sched, а на каждой ноде (и сервере если он тоже будет в работе) единственный процесс pbs_mom
Рабочей директорией по умолчанию является /var/spool/torque/. После установки нужно инициализировать сервер, что можно сделать командой pbs_server -t createЧтобы все ноды были видны с сервера, их заресолвленные имена должны быть вписаны в ./server_priv/nodes, а на каждой ноде в ./torque/mom_priv/config вписать строку $pbsserver имя_сервера Проверить правильность установки нод можно командой pbsnodes -aзавершить процесс можно командой qterm -t quick echo "sleep 30" | qsubЭто задание провисит 30 секунд и сдохнет. Если задания висят в очереди и не хотят работать, то нужно проверить наличие запущенного pbs_sched и состояние сервера: qmgr -c 'list server'
Нормальное рабочее состояние сервера это server_state = Active, если вместо Active там Idle, то нужно перезапустить pbs_server с параметром -a
Работа с очередями Создание новой очереди и задание ключевых параметров: qmgr -c "create queue batch queue_type=execution"Время указывается в секундах. Установить очередь по умолчанию: qmgr -c "set server default_queue=batch" Установка заданий в очередь Ставить задания в очередь с помощью команды qsub: qsub -l nodes=nodesnum -V -q queuename tg-l указывает на количество запрашиваемых ресурсов, например nodes=3:ppn=4 потребует по 4 ядра на каждой из 3-х нод. -V очень важный параметр, показывает что TORQUE следует использовать пользовательские переменные окружения, без нее он даже ~/bin не найдет. -q это название очереди tg это название специального скрипта, в простейшем виде выглядящего так: #PBS -N test -l параметры выделения ресурсов (используются если они не заданы явно в qsub) Скорее всего, есть способы ставить задания в очередь и без промежуточных скриптов, но и с ними неплохо. Если qsub запускать без параметров, то будут использоваться параметры из tg, если их нет и там, то из свойств запускаемой очереди. Управление заданиями qstat -a просмотреть полный список заданий в очереди qdel number удалить задание number из очереди (только для владельца задания и администраторов) qdel all удалить все задания из очереди
|
![]() ![]() ![]()
Категория «Стихи»
Взлеты Топ 5
Падения Топ 5
![]()
Популярные за сутки
|
Загрузка...

BlogRider.ru не имеет отношения к публикуемым в записях блогов материалам. Все записи
взяты из открытых общедоступных источников и являются собственностью их авторов.
взяты из открытых общедоступных источников и являются собственностью их авторов.