Впервые здесь? Можно начать с демо-тренировки инцидента, она бесплатна и не требует регистрации.
Обзор доклада о применении SRE-практик в управлении ЖКХ
Chaos Mesh — инструмент для хаос-инжиниринга в Kubernetes, позволяющий тестировать отказоустойчивость систем
Post Mortem — это анализ причин, шагов, последствий инцидента, который проводится после его завершения
Обзор популярных инструментов для мониторинга IT-систем: Prometheus, Grafana, ELK Stack и другие
Incidenta — тренажер IT-инцидентов для тех, кто релизит и тех, кто чинит
Практические тренажеры для обучения DevOps без риска для продакшена
SRE (Site Reliability Engineering) — инженерная дисциплина, объединяющая разработку и эксплуатацию систем
SRE инженер обеспечивает надежность IT-сервисов, балансируя между скоростью разработки и качеством эксплуатации
Основные навыки и инструменты, которые нужно освоить для карьеры в DevOps
Оставайся в курсе событий: подпишись на нашу RSS-ленту
Освой сбои на темы
Очереди
База данных
Сеть
Диск
Приложение
Ресурсы
Как хочешь двигаться дальше?