История

История СУПЗ или позднее СУППЗ неразрывно связана с разработкой отечественных супер-ЭВМ серии МВС. В 1994 году НИИ «Квант» выпустил первую машину данной серии МВС-100. Система объединяла до 64 вычислительных модулей, каждая из которых содержала два процессора – вычислительный (Intel i860) и коммуникационный (транспьютер Т800). Операционная система на вычислительных модулях отсутствовала, задача загружалась через сеть коммуникационных процессоров и выполнялась на вычислительном процессоре без ОС. Работой сети коммуникационных процессоров управляла операционная среда Router, разработанная в ИПМ им.М.В.Келдыша РАН. Основной задачей ОС Router было обеспечение информационных обменов между вычислительными процессами, но помимо этого ОС Router выполняла функции управления вычислительными ресурсами: сброс вычислительного процессора, загрузка задачи на счет, обеспечение файлового ввода-вывода. Загруженная в МВС-100 задача занимала решающее поле целиком. ОС Router можно считать первым и самым дальним прототипом СУПЗ.

Программирование и использование МВС-100 требовало достаточно высокой квалификации от пользователя, из-за чего круг пользователей МВС-100 был сравнительно узок. Как правило, все пользователи работали в одной лаборатории, что позволяло разграничивать доступ к МВС-100 организационными мерами (пользователи лично договаривались друг с другом об очередности расчетов на МВС-100).

Наиболее широким круг пользователей МВС-100 был в ИММ УрО РАН г.Екатеринбурга. Именно там впервые для автоматизации построения очереди к МВС-100 Сергеем Владимировичем Шарфом в 1995 году была разработана система очередей для МВС-100. Для МВС-100 применение указанной системы ограничилось рамками ИММ УрО РАН.

В 1998 году НИИ «Квант» совместно с институтом РАН создал следующую супер-ЭВМ серии МВС – МВС-1000. Архитектура МВС-1000 была аналогичной МВС-100, только в качестве вычислительного процессора использовался DEC Alpha, а в качестве коммуникационного – TMS C40. На вычислительном процессоре функционировала ОС VxWorks, что повлекло за собой усложнение схемы управления. Одновременно с этим стал расти круг пользователей МВС-1000, и потребовалась организация удаленного доступа к системе через Интернет. Для упрощения работы пользователей в ИПМ им.М.В.Келдыша РАН под руководством Алексея Оттовича Лациса при участии М.Ю.Храмцова и А.В.Баранова была создана система запуска задач для МВС-1000. Опираясь на возможности ОС Router, система запуска позволяла разделять решающее поле между несколькими задачами разных пользователей с автоматической блокировкой занятых процессоров.

Новые возможности быстро привлекли к МВС-1000 новых пользователей, и в 1999 году стало понятно, что без организации эффективной системы очередей не обойтись. Основой для новой системы очередей послужила упомянутая выше разработка ИММ УрО РАН, при этом были применены новые принципы формирования очереди, а сам код системы очередей был полностью переписан. Именно этот вариант сочетания системы запуска задач и системы очередей и получил название СУПЗ. В том же 1999 году МВС-1000, оснащенная СУПЗ, стала первой российской супер-ЭВМ, установленной во вновь открытом Межведомственном суперкомпьютерном центре (МСЦ) РАН.

В 2001 году в МСЦ РАН была установлена система МВС-1000М – первая отечественная супер-ЭВМ, перешагнувшая терафлопный рубеж производительности. Несмотря на схожесть названия, МВС-1000М имела совершенно другую (кластерную) архитектуру по сравнению с МВС-1000. Новая кластерная архитектура потребовала существенной переработки СУПЗ, поскольку для управления вычислительными ресурсами теперь требовалось использовать не ОС Router, а встроенные возможности ОС Linux, установленной на всех вычислительных модулях кластера МВС-1000М. Следует отметить, что на данном этапе коллективом разработчиков ИПМ им. М.В.Келдыша РАН было проведено аналитическое исследование существующих альтернатив СУПЗ. Исследование показало, что на тот момент доступных аналогов СУПЗ на мировом рынке не было, предлагаемые продукты не отвечали требованиям к безопасности и функциональности МВС-1000М. Совместно с МСЦ РАН было принято решение о доработке СУПЗ и ее установке на кластер МВС-1000М. Время показало правильность сделанного выбора, за прошедшие 10 лет СУПЗ доказала свою надежность, а доступные аналоги появились лишь спустя несколько лет.

В 2001 году установленная на МВС-1000М СУПЗ фактически приобрела архитектуру и структуру, которые составляют ее основу по сей день. СУПЗ обеспечивает управление вычислительными ресурсами и пользовательскими задачами 24 часа в сутки 365 дней в году.

В 2002 году к СУПЗ была добавлена подсистема сбора и обработки статистики (биллинг). Через год, в 2003 году, появилась поддержка ресурсов локальной дисковой памяти, что потребовало очередной серьезной переработки компонентов СУПЗ.

В 2004 году без значительных затруднений СУПЗ была портирована на новую супер-ЭВМ МВС-15000, а в 2007 году – на МВС-100К.

С 2004 года СУПЗ дополняется возможностями работы в грид и является основой Российской инфрастурктуры для суперкомпьютерных приложений (РИСП).

В 2008 году в СУПЗ появляется поддержка гетерогенных вычислительных ресурсов, а также PBS-совместимый интерфейс.

В 2009 году реализована возможность подключения к СУПЗ планировщика Maui, система в такой конфигурации уже более года эксплуатируется на экспериментальном стенде МСЦ РАН.

В 2010 году начался процесс формирования СУПЗ как законченного программного продукта с коробочной версией.

В начале 2011 года было решено открыть исходные коды оболочки СУПЗ для привлечения новых разработчиков к проблеме, связанной с низкой эффективностью использования суперЭВМ.