Программа представляет собой мониторинг состояния вычислительных узлов кластера как необходимое условие поддержания работоспособности вычислительного поля. Разработанная программа для системы мониторинга Nagios позволяет контролировать использование оперативной памяти, температуру и потребляемую мощность для каждого из 6 GPU-процессоров вычислительного узла и производить раннее обнаружение однобитных и двубитных ошибок оперативной памяти. Bourne Shell