Текущая ситуация
В Пермском крае есть информационная система «Стройкомплекс» — единый ресурс с информацией о состоянии строительной отрасли и автоматизации контрольно-надзорной деятельности в регионе.
Одна из её подсистем — «СтройКонтроль» — предназначена для автоматизации процессов экспертно-проверочных мероприятий: ведения реестра объектов строительства, добавления проверок, нарушений и осмотров, ведения справочников, визуализации статистических данных и т.д.
Её пользователи — специалисты Министерства строительства Пермского края, Инспекции государственного строительного надзора, органов местного самоуправления муниципальных образований и исполнительных органов государственной власти Пермского края, а также юридические лица, осуществляющие деятельность в области строительства.
Проблема
Если не заниматься технической поддержкой подсистемы, пользователи не смогут актуализировать данные об объектах строительства в регионе.
Задачи
Обеспечивали непрерывную работу подсистемы, в том числе:
- работали с обращениями пользователей
- оперативно устанавливали обновления
- проводили мониторинг работоспособности системы
- проводили анализ производительности системы и анализ действий пользователей
- восстанавливали работоспособность системы при нештатных ситуациях
Как мы работали
Поддержка пользователей
В рамках задачи по поддержке пользователей подсистемы обрабатывали и предоставляли решения для обращений, поступивших к нам через СУИ — Систему управления инцидентами. У этой задачи есть чётко установленные сроки, параметры и критерии выполнения, которые прописаны в SLA, соглашении об уровне обслуживания между нами и заказчиком.
Поддержка пользователей включает в себя настройку конфигурации системы, предоставление прав доступа для новых пользователей, формирование выборок на основании данных подсистемы, а также разметку планов строительных объектов в регионе.
Подробнее о разметке. У каждого объекта строительства в подсистеме «СтройКонтроль» есть план помещений, который нужен надзорным органам для проведения проверок и выявления нарушений при строительстве. Наша задача — загрузить чертежи в систему и нанести на них разметку для автоматического распознавания осей в рамках локализации места нарушения.
Работу над задачей осложнили большой объём объектов для разметки и нестандартные чертежи, поэтому на проект мы подключили сразу пять специалистов техподдержки. Чтобы стандартизировать и ускорить разметку, разработали инструкции с конкретными примерами.
Решение инцидентов
В рамках задачи по решению инцидентов в той же системе СУИ получали обращения о неисправности подсистемы «СтройКонтроль»: либо автоматически от систем мониторинга, либо от пользователей системы.
Сначала проводили диагностику и анализ инцидента. Если информации не хватало, то запрашивали её у пользователей или заказчика. В процессе расследования инцидента проверяли и собирали доказательства с серверов, сетевых устройств и выполняли мероприятиях нетехнического характера.
Все предположения и выводы о причинах инцидента подкрепляли журналами (логами), скриншотами, дампами памяти и другими диагностическими данными.
Мониторинг и обеспечение доступности системы
Для обеспечения доступности и работоспособности подсистемы проводили мониторинг продуктивного контура. Контролировали следующие параметры: состояние памяти и загруженность серверов, объём занятого и свободного места на диске, другие показатели утилизации аппаратных ресурсов серверов, а также параметры быстродействия функций подсистемы.
Регламентное обслуживание
Для обеспечения и повышения отказоустойчивости подсистемы, а также для снижения рисков потери данных проводили регламентные мероприятия:
- резервное копирование
- контрольное восстановление подсистемы из резервной копии
- обновление подсистемы
- нагрузочное тестирование
Каждое регламентное мероприятие заканчивалось фиксацией результата в Системе управления инцидентами.
Отчёт
После каждого этапа контракта менеджер проекта отправлял заказчику отчёт об уровне оказания услуг. В него входят документы:
- журнал обращений пользователей
- журнал по решению инцидентов
- отчёт о недоступности подсистемы
- журнал проверок резервных копий
- журнал контрольного восстановления из резервных копий
- журнал обновления подсистемы
- журнал нагрузочного тестирования подсистемы
А ежедневный отчёт о работе менеджера выглядит проще и реализован через чат с заказчиком.
Технологии
Nginx, MongoDB, CSS