Availability Management

14.11.2014

Цели Availability (работоспособность) Management:
Представляет план управления работоспособностью, т.ч.:
- все сервисы и контракты поддержаны КЕ
- где нет поддержки КЕ, должны быть контракты с 3-й стороной
- изменения – превентивные меры против потери работоспособности
Только когда ИТ компания обеспечивает определённый уровень работоспособности могут заключаться SLA

Аспекты работоспособности:
- надёжность
- поддержка
- живучесть
- ремонтопригодность
- безопасность (доступность, конфиденциальность, целостность)

Жизненный цикл инцидента:
Инцидент
Определение
Диагностика
Ремонт
Восстановление
Реставрация

MTTR – Mean Time To Repair (Downtime)

MTBF - Mean Time Between failures (Uptime)

MTTR + MTBF = MTBSI – Mean Time Between System Incidents

Когда заказчик не может работать?

Когда IT сервисы не работоспособны: место и функции со знаком "-", хотя SLA со знаком "+".

Например: 98% от согласованного числа часов обслуживания может обеспечиваться, 2% простоя в самое неподходящее время.

Помним, что система из двух элементов имеет разную надёжность в зависимости от соединения:
Последовательно (0,9*0,9=0,81).
Параллельно (1-0,1*0,1=0,99).

Лучшие практики:
Отделять проект от измерений.
Не отделять от планирования (contingency) случайностей и контроля.
Использовать связи с Capacity, Finance, Contingency.
Позволить этому процессу предлагать нормы для измерения

Выгоды бизнеса:
- чёткие метрики базового уровня позволяют заключать качественные SLA.
- чёткая статистика ведёт к лучшей поддержке.
- улучшение качества и поддержки ИТ инфраструктуры.
- улучшение для конечных пользователей (достигаются специфические цели работоспособности).
- улучшается уровень сервисов, так как проактивное лучше реактивное решение проблем.
- лучше обоснование цены и эффективности ИТ.

Трудности:
- затраты на процесс малы или велики.
- сложность оценить количество и стоимость требований пользователей к работоспособности.
- трудно найти опытных ИТ специалистов.
- множество инструментов требуется для измерения базового уровня.
- зависимость от заказчика.
- сложность охвата всей ИТ инфраструктуры.

Постоянный адрес статьи в Интернет: http://www.ispl.ru/Availability_Management.html

Ключевые слова: availability, management, mttr, mtbf, mtbsi, downtime, uptime
Управление ИТ-услугами
Главная
(C) Л.Точилов