В проекте наши цели — надежность, скорость и безопасность. Это касается каждого аспекта работы. В качестве основы используем практику DevOps.
Примеры
Проблемы каждого заказчика уникальны, но решения повторяются. Ниже собрали наиболее частые:
Проблема №1
- в системе происходят непонятные сбои
- существующие средства мониторинга не дают ответов
Решение - мониторинг и логирование
- настроим под задачу современные инструменты мониторинга Grafana, Victoriametrics и ELK (при необходимости)
- (опционально) LibreNMS для сетевой инфраструктуры
- совместно определим системные и бизнес-метрики
- предоставим web-панели с предиктивным мониторингом
- найдем проблему (в приложении, сервере или сети) → предложим решение
- напишем понятную документацию
Проблема №2
- есть сомнения — справится ли система с ожидаемой нагрузкой
- нужно точно знать предельную производительность системы перед релизом
Решение — нагрузочное тестирование
- напишем нагрузочные тесты на Yandex Tank
- проведем тесты API, сервисов и интеграций
- проведем приемо-сдаточные испытания
- предоставим документацию для самостоятельного запуска тестов
- установим фактические лимиты производительности и визуализируем предельные нагрузки на сервисы
Проблема №3
- частая ручная миграция приложений между облаками и собственной инфраструктурой (IaaS — > DBaaS, IaaS → on-premise и.т.д.)
Решение — IaC
- опишем инфраструктуру кодом Terraform, Salt и Ansible
- развернем в целевом местоположений
Проблема №4
- развертывание релиза занимает много времени, а собственной DevOps команды нет
- объемы и процесс разработки требуют новых сред
Решение — CI/CD
- развернем GitLab и реализуем CI/CD на базе Gitlab CI
- настроим автоматическую сборку и доставку релизов
- (опционально) подключим SAST инструменты
Проблема №5
- несмотря на все усилия, сервер раз в месяц захватывает майнер или битлокер
- данные безвозвратно теряются
Решение — резервное копирование
- организуем резервное копирование для Win и Linux
- (опционально) мониторинг процедур резервного копирования
- (опционально) оповещение в Telegram/Slack
- (опционально) закроем ваши сервера VPN сервером
- разработаем и ПРОВЕРИМ план восстановления после сбоя (DRP)
Проблема №6
- в системе накопился видимый технический долг, который можно и нужно закрывать в “неаварийном” режиме, но:
- нет собственной инфраструктурной команды или у нее пока нет опыта
- команда есть, но она загружена, требуется временное усиление
Решение — поддержка внешней командой
- долгосрочный план работ на несколько месяцев
- ничего лишнего — только те задачи, которые одобрил заказчик
- ежемесячный отчет о выполненных работах и сверка прогресса
- наставничество для начинающих Ops команд
Проблема №7
- невозможность поддерживать работу коммерческого ПО (vmware, microsoft)
Решение — миграция на свободное ПО
- многое зависит от архитектуры, но альтернативы существуют
Проблемы нет в списке?
Свяжитесь с нами — первичное обследование бесплатно.