Service Level Agreement — ваш способ перевести абстрактные обязательства типа «Оперативное исправление ошибки» в конкретные цифры
Сайт рухнул в час пик. Критическая функция в приложении не работает. Вы звоните подрядчику: «Когда почините?» Ответ: «Работаем» или «В договоре точных сроков нет». Ваши деньги и репутация утекают, а виноватых нет.
Ситуация неприятная и, к сожалению, нередкая. Особенно если сопровождение проекта базируется не на конкретных договоренностях на бумаге. Например, «оперативное исправление ошибки» — сколько это в часах? Или, может быть, в днях?
Защитой от такой неопределенности служит Service Level Agreement (SLA), оно же Соглашение об уровне обслуживания. Это ваш гарантийный талон в отношениях с IT-подрядчиком, который превращает абстрактные обещания в точные цифры и сроки.
Но как правильно составить SLA? Что включить в него? Что именно дает такое соглашение вам и подрядчику? Давайте посмотрим, из чего складывается надежность сервиса.
Соглашение об уровне обслуживания в IT-сфере — это формальный документ, в котором прописаны гарантированные параметры качества и доступности сервисов, сроки предоставления сервисных услуг, а также меры ответственности за неисполнение условий. Однако это больше чем просто перечень сервисных обязанностей исполнителя. Правильно составленное SLA распределяет ответственность за достижение результатов между заказчиком и подрядчиком.
В классическом виде SLA зародились в телекоммуникациях и дата-центрах в 1990-х: оператор обещал, например, 99,9 % времени работы линии и фиксированные сроки устранения неполадок. С ростом облачных платформ и аутсорсинга в 2000-х SLA перекочевали в сферу IT-разработки.
От наличия правильно составленного соглашения выигрывает и заказчик IT-продукта, и его разработчик.
Вот что получает заказчик:
Понятные критерии оценки работы подрядчика. Не пространные формулировки, а измеримые показатели.
Возможность планировать внутренние процессы (маркетинг, продажи, техподдержку) на основе гарантируемого уровня доступности и отклика. И не только сами процессы, но и бюджет на них.
База для оценки эффективности капиталовложений. По тому, какие условия прописаны в SLA и насколько они соблюдаются, можно отчасти судить о том, стоят ли услуги подрядчика тех денег, которые вы платите.
Выгоды для подрядчика:
Зафиксированные границы ответственности. Это помогает избежать путаницы и конфликтов, связанных с распределением задач и устранением проблем.
Улучшение отношений с клиентами. Понятные и прозрачные условия SLA способствуют повышению доверия со стороны клиентов и укрепляют долгосрочные партнерские отношения.
Оптимизация ресурсов. SLA позволяет подрядчику точнее прогнозировать нагрузку на поддержку, оптимизировать ресурсы и планировать работы.
Четкий порядок поддержки здесь важен, прежде всего, из-за ненормированных нагрузок. Многие приложения и веб-сервисы работают в режиме нон-стоп. Клиенты приходят из разных часовых поясов, бизнес-процессы не останавливаются ни в праздники, ни в выходные. А архитектура современных продуктов все чаще строится на микросервисах и внешних API — от платежных шлюзов до push-уведомлений и геолокации. Все это требует, чтобы подрядчик обеспечивал постоянный мониторинг, оперативное масштабирование ресурсов при росте нагрузки и четкие договоренности по взаимодействию со смежными сервисами. Для конкретизации таких обязательств и предназначен SLA.
Если такого Соглашения нет или оно составлено небрежно, брешей в обслуживании становится больше:
внезапный рост трафика приводит к перегрузке серверов и падению сайта именно в час пик;
критический сервис, например, платежный API, может не отвечать, а вы теряете сделки и клиенты переходят к конкурентам;
push-уведомления застревают в очереди или не отправляются вовсе, и пользователи не получают важные оповещения (смена статуса заказа, акционные предложения).
Каждый из этих сбоев снижает лояльность аудитории и напрямую отражается на выручке.
Правильно выбранные и сформулированные SLA-метрики (например, доступность в 99,9 % времени, 15 минут до первого ответа, 2 часа на восстановление) помогают заранее прогнозировать, сколько инженеров и какое время будут задействованы в поддержке. Это дает возможность рассчитать стоимость круглосуточного мониторинга, определить интервалы для плановых обновлений и заложить резерв на экстренные работы.
Оговоримся сразу: каждый SLA уникален. Содержание и глубину проработки такого документа всегда задает специфика проекта:
тип продукта (веб, мобильное приложение и т. д.);
ожидаемая нагрузка;
критичность бизнес-процессов;
архитектура (микросервисы или монолит);
оговоренный бюджет и регламент поддержки.
Учитывая эти нюансы, подрядчик и заказчик совместно определяют перечень сервисов, целевые показатели и процедуры взаимодействия. Впрочем, можно выделить набор базовых компонентов, формирующих основу эффективного SLA. Именно о них мы и поговорим далее.
Четкое описание того, какие сервисы и задачи входят в поддержку, а какие остаются за рамками договоренностей, — основа любого SLA. Для веб- и мобильных приложений это может выглядеть так:
включено: исправление критических багов, обновление серверного ПО, мониторинг доступности и производительности, поддержка интеграций с платежными и пуш-сервисами.
исключено: доработка новых функций, решение проблем, вызванных сторонними API при просадке их инфраструктуры (подрядчик здесь только обеспечивает мониторинг статуса и информирует заказчика), тренинг внутренних команд заказчика.
SLI (Service Level Indicator) — конкретная метрика качества сервиса: время отклика, процент доступности, время восстановления после инцидента.
SLO (Service Level Objective) — целевое значение этой метрики, которую подрядчик обязуется обеспечивать. Например, время отклика ≤ 500 мс, доступность ≥ 99.9%, восстановление рабочего состояния в срок до 3 часов.
Важно согласовать именно те SLO, которые влияют на достижимость нужных вам бизнес-результатов.
Без отчетности SLA бесполезен. Важно зафиксировать не только сами показатели уровня сервиса, но и способ их сбора, периодичность отчетов, формат и аудиторию получателей. Включите в документ следующие пункты:
Методики расчета выбранных метрик. Стоит прописать и используемые формулы, и конкретные инструменты — например, Prometheus, DataDog, GMonit.
Инструменты мониторинга. Перечислите, какие системы и сервисы предполагается использовать, опишите способ доступа к данным (дашборд, API, экспорт в CSV).
Периодичность и формат отчетов. Для технической команды рекомендуем собирать отчеты еженедельно, для руководства и заказчика подойдет месячная периодичность.
Целевые аудитории и необходимые им типы отчетов.
Чтобы поддержка была эффективной и в техническом, и в экономическом плане, ее следует распределять по нескольким уровням:
Уровень 1 (L1), служба поддержки. Прием заявок через тикет-систему или чат-бот, первичная диагностика.
Уровень 2 (L2), узкие специалисты (DevOps, backend). Решение стандартных и повторяющихся ошибок по шаблонам.
Уровень 3 (L3), архитекторы и разработчики. Анализ глубоких проблем, внесение изменений в код или инфраструктуру.
Если на первом уровне решить проблему невозможно, сообщение о ней передается на следующий уровень и так далее. Но, чтобы эта система работала слаженно и не требовала лишнего контроля, важно формализовать правила эскалации запроса в SLA. Укажите для каждого уровня каналы связи, определите ответственных лиц, задайте тайминги.
Привязка финансовых последствий к фактическим результатам стимулирует подрядчика держать планку:
штрафы — например, за каждый процент простоя ниже заявленного SLO;
бонусы — например, если результаты превзошли целевые показатели.
Эти пять элементов формируют каркас надежного SLA. Они гарантируют прозрачность ожиданий, надежные механизмы контроля и понятные финансовые стимулы. Вместе это снижает риски и повышает качество поддержки ваших веб- и мобильных продуктов.
Хорошее SLA не появляется по волшебству. Это результат вашей активной позиции как заказчика. Вы должны не писать документ самостоятельно, а грамотно управлять процессом его создания и контроля. Даем пошаговую инструкцию, как это организовать.
Не надейтесь, что подрядчик сам поймет ваши приоритеты. Ваши действия:
Сформулируйте главные риски. Отталкивайтесь от того, что больнее всего ударит по бизнесу при сбое? Примеры формулировок: «Минимизировать риск простоя платежного шлюза», «Гарантировать стабильность API для личного кабинета VIP-клиентов».
Расставьте приоритеты. Стабильная доступность функции оплаты критична, а, например, скорость доставки промо-уведомлений допускает отклонения.
Теперь нужно, чтобы обозначенные болевые точки стали измеримыми обязательствами в SLA. Что нужно сделать:
Для самых критичных зон требуйте более строгих SLO (например, 99.95% доступности оплаты, восстановление за 1 час). Для менее важного можно согласовать менее жесткие критерии.
Обговорите с подрядчиком, какие метрики вы ожидаете увидеть в SLA, и настаивайте на конкретных целевых показателях.
Уточните, как именно подрядчик будет измерять показатели и как вы будете получать данные.
SLA – это всегда договоренность. Ваши действия:
Обсуждайте предложенные SLO. Если подрядчик говорит, что 99.9% uptime будет стоить вдвое дороже 99.5%, требуйте обоснования. Важно найти баланс между безопасностью бизнеса и бюджетом.
Четко оговорите условия и пределы исключений. Одно дело форс-мажор типа DDoS. И совсем другое дело проблемы хостинг-провайдера подрядчика или его ошибки в коде.
Определите правила применения санкций. Штрафные санкции — ваша защита. Они должны компенсировать ущерб и мотивировать подрядчика. Следите, чтобы формула расчета была понятной, и предлагайте выполнимые условия.
Утвердите SLA совместно. Проведите финальную встречу, где обе стороны подтверждают понимание всех пунктов.
Подписание SLA – не финиш. Здесь начинается активная работа, которая будет требовать вашей высокой вовлеченности:
Регулярно изучайте отчеты. Сверяйте их с реальностью. Если сайт был недоступен, а в отчете об этом ничего не сказано, запрашивайте детализацию данных мониторинга.
Контролируйте соблюдение всех условий. В том числе и в части санкций. Если SLO не выполнены, напоминайте подрядчику о договоре.
Инициируйте пересмотр SLA. Делать это можно раз в полгода/год или после крупного обновления продукта. SLA должен развиваться вместе с вашим продуктом.
Эффективное SLA — это не документ, а процесс, который вы контролируете. От четкой постановки целей, через активные переговоры, к постоянному мониторингу и адаптации. Это ваша главная гарантия стабильности цифрового продукта и партнерства с подрядчиком, основанного на ясных правилах и взаимной ответственности.
Читайте также:
Заказная разработка: как выстроить работу с подрядчиком
Fixed Price vs Time and Material: как правильно выбрать модель оплаты