Нижегородский институт прикладных технологий

Внедрение ООО «НИПТ» системы мониторинга сети и ИТ - инфраструктуры

Специалисты ИТ подразделения НИПТ реализовали последний этап проекта по внедрению системы мониторинга сети и ИТ инфраструктуры, позволив вести подробную статистику и получать различного рода уведомления при наступлении определенных ситуаций, для определения что является первичным фактором в нарушении работы инфраструктуры, а что — производными факторами. Эти данные позволят направлять силы IT-службы на устранение именно причины проблем, а не следствий. Таким образом, решается вопрос о приоритетности проблем.

Мониторинг ИТ-систем является составной частью управления информационной инфраструктурой предприятия, заключающейся в постоянном наблюдении и периодическом анализе ИТ-объектов с отслеживанием динамики происходящих с ними изменений. Ключевой задачей системы мониторинга является получение, сохранение и анализ информации о состоянии подконтрольных элементов ИТ-структуры компании.

Специальная программа позволяет оперативно реагировать на возникшую проблему в работе сервисов, а также эффективно предотвращать возникновение неполадок:

- уровень обработки данных;
- распределенное хранение статистики;
- горизонтальное и вертикальное масштабирование системы;
- хранение данных в исходном, неагрегированном виде;
- дедупликация и агрегация информации;
- корреляция событий на основе временных меток и сервисной модели;
- гибкая настройка политик оповещения о состоянии оборудования и услуг.
- автоматическое вычисление динамических границ допустимого поведения - параметров на основе исторических данных (baseline).
- прогнозирование изменения значений параметров на основе исторических данных для предупреждения пользователей о возможной аварии.
- оповещение пользователей посредством электронной почты, SMS и звуковых сигналов при превышении пороговых значений.
- Использование API для интеграции с внешними корпоративными ИТ-системами.

Системы мониторинга ИТ инфраструктуры предназначены для контроля работоспособности следующих компонентов: сетевое и серверное оборудование, ПО для бизнеса. Под контролем программы мониторинга теперь находятся группы объектов, информация о которых необходима администраторам.

Внедрение комплексной системы мониторинга помогло предприятию:

- снизить время простоя компонентов ИТ-структуры;
- увеличить доступность программ для бизнеса;
- повысить уровень производительности использования информационных ресурсов;
- своевременно фиксировать возникновение проблем в работе компонентов ИТ-структуры;
- локализовать место и характер неполадки;
- определять влияние возникшей проблемы на возможность предоставления ИТ-сервисов (это необходимо для расстановки приоритетов в работе по ликвидации сбоев);
- проактивно следить за изменениями в функционировании инфраструктуры;
- предотвращать вероятные сбои;
- вести отчетность.

Системы мониторинга ИТ сервисов ориентированы, в первую очередь, на показатели степени доступности, а также качества предоставления сервисов на основе оценки пользователей. В процессе создания системы происходит формирование каталога ИТ-сервисов. Определяются показатели доступности и уровня качества каждого сервиса и его зависимость от других компонентов информационной структуры компании. Система проводит мониторинг и формирует показатели работы сервисов. Мониторинг ИТ-систем полезен системным администраторам, руководителям и менеджерам ИТ-сервисов.

Значительное внимание при создании системы мониторинга было уделено обеспечению безопасности данных. Система поддерживает шифрование как на уровне хранимых данных, так и в рамках протоколов взаимодействия между своими компонентами. Ролевое управление доступом в системе позволяет настраивать иерархические права доступа для пользователей и их групп вплоть до конкретных объектов мониторинга, делая возможным создание политик доступа для организаций с территориально распределенной филиальной структурой (центральный аппарат, региональные подразделения и т. д.).

Внедрение автоматизированной системы мониторинга ИТ и контроль работы информационной инфраструктуры повысило уровень качества ее функционирования с помощью быстрого выявления и ликвидации сбоев и неполадок, а также предотвратило их возникновения в будущем, в первую очередь, для наиболее критичных для компании сервисов.