О проекте
СУПЗ (система управления прохождением задач) или СУППЗ (система управления прохождением параллельных заданий) – система планирования запуска и прохождения параллельных заданий, которая позволяет пользователям решать больше задач за меньшее время, указывая потребности в ресурсах и приоритеты задач, в итоге увеличивается утилизация ресурсов. СУПЗ обеспечивает контроль и наблюдение над процессами эффективной загрузки ресурсов из единой точки, предоставляет периодическую отчётность о загрузки ресурсов.
СУПЗ предназначена для многопользовательских и/или многозадачных вычислительных и Грид систем, в частности для суперкомпьютеров с распределённой памятью. СУПЗ является системой пакетной обработки заданий, в которой используются достижения современной науки.
СУПЗ определяет очередность выполнения задач. СУПЗ запускает задание, исходя из его приоритета, количества и качества требуемых ресурсов. СУПЗ предоставляет возможность контролировать задание на всех стадиях его выполнения: поставка в очередь, наблюдение в очереди с прогнозом времени начала непосредственного счёта, удаление из очереди, снятие задания со счета, наблюдение и управление заданием в ходе выполнения с предоставлением контроля над ресурсами, на которых выполняется задание, снятие задания со счёта.
Планирование заданий производится в соответствии с режимом планирования счёта различных категорий задач: пакетных, фоновых и отладочных. Режим планирования определяют параметры календарного времени, максимального времени счёта отладочных и пакетных задач, максимального числа процессоров для отладочных задач, шкалы приоритетов задач.
СУПЗ поддерживает Грид-систему – СУ ССРВ (систему управления сетевой средой распределенных вычислений).
Основные особенности СУПЗ:
- Хорошая способность к масштабированию по количеству вычислительных модулей (ВМ) в вычислительной системе и по количеству задач в очереди;
- Использование последних достижений науки в системах пакетной обработки (СПО);
- Поддержка различных API;
- Удобный интерфейс управления и наблюдения для параллельных задач конечного пользователя;
- Использование различных алгоритмов планирования, исходя из специфики сайта установки. Основной алгоритм был разработан российскими учеными из Института прикладной математики им. М.В.Келдыша РАН;
- Способность работать с различными интерфейсами коммуникационных сетей, в частности InfiniBand, Myrinet, Ethernet.
Разработка проекта продолжается. В планах на ближайшее будущее:
- Поддержка гибридных систем Intel CPU/Intel MIC
- Поддержка интерфейса SLURM
- Оптимизация систем квотирования и билинга
- Разработка модуля мониторинга пользовательских задач
- Усовершенствование модуля отчётности об использовании ресурсов
- Создание сообщества разработчиков OpenSource версии