SRE. Рецепты выживания в продакшне для инженера по надежности

SRE. Рецепты выживания в продакшне для инженера по надежности

Надежность умирает последней. Главное, чтобы она вообще была. Это можно принять за шутку, если не знать, насколько все серьезно. Инженер по надежности, с двадцатилетним опытом работы в IT-индустрии, дает 61 полезный совет коллегам, имеющим дело с крупными, а также небольшими системами. Правила написаны емко и по существу, с нотками иронии и юмора, поэтому, даже несмотря на использование профессионального сленга, «пособие для выживания» читается легко. Рецепты основаны на многолетней практике, собственных ошибках и чужих граблях, и они могут стать незаменимой инструкцией для тех, «кто в теме».

Жанры: Информатика и вычислительная техника, Прикладная литература
Цикл: Не является частью цикла
Год публикации: 2024

Читать онлайн SRE. Рецепты выживания в продакшне для инженера по надежности


Об управлении надежностью

«Управление надежностью похоже на искусство капитана на корабле: предсказываешь штормы, избегаешь подводных камней и сохраняешь хладнокровие в нестандартных ситуациях. Так корабль плывет безопасно и плавно.

Ненадежный корабль не завоюет доверие пользователей и не обеспечит конкурентоспособность компании. Управлять надежностью сервиса – обязанность каждого капитана сервиса и компании».

Александр Тармолов, руководитель отдела разработки международных веб-решений в Яндекс Картах


«Ошибки в коде и проблемы неизбежны. Очень неприятно и стрессово смотреть на то, как после релиза твой сервис постепенно (или моментально) падает. Но еще хуже, когда в этот момент у тебя нет плана действий и ты просто наблюдаешь, не в силах что-то сделать.

Но если к таким ситуациям правильно готовиться – можно заранее понять, что что-то идет не так, и не довести до падения. Либо снизить влияние на пользователей (можно даже так, что они особо ничего не заметят) и быстро все починить (а для этого нужны инструменты, планы действий для таких ситуаций).

Стресс все равно будет, но гораздо лучше рассказывать коллегам байки за бокалом пенного, как мы героически всех спасли, чем ужасы, как лежали часами и потеряли много лояльных пользователей».

Николай Животворев, руководитель клиентской разработки в Okko (в прошлом – Дзен, Яндекс. Эфир, главная Яндекса)


«Управление надежностью начинается не с конкретных процессов или систем, а с построения принципов работы команды разработки. Особенно это проявляется в Data-Driven направлениях, где дата-инженерам куда проще следить только за надежностью напрямую контролируемых ими ETL-процессов, чем за всей системой целиком, включая поставляемые другими отделами данные. Именно выстраивание принципов команды (как мы работаем, как мы считаем неприемлемым работать, как мы контролируем качество работы смежников, какое качество сервиса мы хотим дать своим пользователям) является основой для построения надежного и полезного для компании продукта».

Максим Пчелин, продакт-менеджер аналитической платформы Nebius (в прошлом – Яндекс, Mail.Ru)


«Информационный продукт появляется на свет как ребенок с иммунитетом, заложенным родителем. Но по мере роста и развития иммунитет нужно тренировать, делать прививки в виде учебных встрясок, интегрировать в себя «ДНК» реальных инцидентов и накапливать ресурсы для столкновения с реальным миром во всем его многообразии. И пусть иммунитет не дает 100% защиты от болезней, но “то, что нас не убивает, делает нас сильнее”, и в конечном счете эволюционную гонку выигрывает наиболее подготовленный организм».

Сергей Савенков, руководитель отдела front-end разработки управления развития розничных систем ООО «МерлионТех»


«Если вы не управляете надёжность своего сервиса – значит, нет у вас никакого сервиса.»

Андрей Столбовский, руководитель разработки в AWS (в прошлом – Яндекс, Вконтакте)

1. Сервис без вмешательства не переживает отключение части свитчей в дата-центре – это плохой сервис

Пришли к нам как-то сетевые инженеры из дата-центра и говорят: «Нам нужно провести работы, для этого мы выключим пару свитчей, запланируйте у себя мероприятия». Обычно в таких ситуациях мы начинали какой-то трафик куда-то переключать, чтобы точно все хорошо прошло, а тут пообсуждали с коллегами и решили, что это неправильная ситуация и лучше мы посмотрим на последствия, а потом что-то улучшим. Всю систему оставили работать в обычном режиме, подготовились к «чему угодно» и стали наблюдать. Все прошло хорошо. С тех пор мы договорились, что в подобных случаях ничего сами трогать не будем, потому что система должна справиться сама.

Деньги:


Вам будет интересно
При изучении языков программирования у учителя очень часто возникает проблема – как придумать индивидуальные задания для каждого учащегося?Данный сборник призван помочь учителям информатики при изучении темы "Работа с двумерными массивами" и содержит 2880 готовых условий задач для программирования на любом языке, допускающем работу с подобным видом данных. Сборник может использоваться как на уроках информатики либо внеурочных занятиях, так и для организации проектной деятельности учащихся.Для уч...
Читать онлайн
Эта книга подводит определенный итог публикациям моих книг, посвященных вопросам анализа результатов применения нейросетей (ИИ)в различных областях образования и культуры. В большинстве случаев эти книги представляют собой практикумы по различным разделам математики, информатики, вопросам тестирования и других дисциплин. И в них, в целом, дается положительная оценка использования нейросетей в качестве наших помощников. И я совсем не думал сейчас подводить какие-либо итоги, Тем более, что осталис...
Читать онлайн
В книге “Нейросеть. Принципы работы и секреты успеха” автор представляет читателям обширный обзор основных принципов функционирования нейронных сетей, а также выявляет ключевые факторы, определяющие их успешное применение. Также рассматриваются основы построения нейронных сетей, их архитектура, принципы обучения и адаптации, а также специфика применения в различных областях: от медицины до финансов. Автор подчеркивает важность правильного выбора алгоритмов обучения, объема данных для тренировки ...
Читать онлайн
Книга предлагает всестороннее исследование профессии бизнес-аналитика ИТ, основанное на 100% практическом опыте автора, реальных сценариях и решениях. Автор, опираясь на десятилетний опыт работы в качестве бизнес-аналитика ИТ, делится исключительными знаниями, основанными на личных успехах.Роль бизнес-аналитиков ИТ объясняется простыми словами, что делает ее доступной не только для профессионалов в этой области, но также для тех, кто вне мира ИТ и стремится попробовать себя в бизнес-анализе.В от...
Читать онлайн
"Невероятно, есть прямая зависимость от количества спящих и увеличивающегося трафика от этого дома", – сказал Федя. Немного слов о нашем герое, в это невозможно поверить, но он путем рассуждений пришел к выводу, что человек и всё живое на земле создано Богом, а точнее группой лиц, не для любви и вечной жизни, а для того, чтобы быть самовоспроизводящимся, самостоятельно ищущим себе энергию, сбивающимся в компактные серверные фермы, мощным вычислительным устройством, когда он спит....
Читать онлайн
В настоящем учебно-методическом пособии приведены основополагающие принципы функционирования криптовалют, на практических примерах обозначены риски их использования, представлены некоторые особенности операций с криптовалютой. Кратко рассмотрена российская судебная практика в сфере виртуальных активов. Намечены перспективы развития рассматриваемой области. На примере сервиса российских разработчиков рассмотрена вероятность оценки совокупности признаков, идентифицирующих субъектов, возможных влад...
Читать онлайн
Автор книги опытный программист, руководитель нескольких американских IT компаний, директор по технологиям и инновациям, который работал с сотнями бизнес-лидеров и государственных деятелей по всему миру.Эта книга – руководство, посвященное новому осмыслению процессов в бизнесе и созданию инновационных бизнес-тенденций с помощью искусственного интеллекта. Автор, посвятивший десятилетие своей жизни научным исследованиям и инновациям, предлагает взглянуть читателю на то, как ИИ влияет на бизнес и о...
Читать онлайн
Что такое ИИ? Это сокращение двух знаковых слов – «искусственный интеллект». Мечты очеловечить прежде мертвые машины давно волновали людей. Об этом слагались многие сказания и мифы. И вот эти невероятные грезы, похоже, начинают сбываться на наших глазах. Человечество встало на путь знакомства с неведомыми прежде поразительными технологическими успехами. И перед нашим взором начинает разворачиваться череда все более удивительных картин нового мира.Бесчисленные передовые отряды представителей мног...
Читать онлайн
Эта книга про сексуальную природу мужчины. Об этом не рассказывают отцы и молчат учителя, об этом не принято говорить в обществе. Но в этом кроется половина мужских проблем: с мотивацией, успешностью, активностью и в отношениях. Рекомендуется к прочтению тем, кто развивается и стремится к большему. Без этих знаний невозможно на полную раскрыть свой потенциал. Про формат: экспресс-книга экономит время. В ней 50% информации обязательная, а вторые 50% – по желанию, для углубленного изучения темы....
Читать онлайн
Московский маг Эдгар снова в деле.На этот раз он столкнется с проблемами, пришедшими к нему из прошлого. Но сможет ли он решить их все?...
Читать онлайн
« – Сядьте, Яков, и не гневите меня! Вы все заблудшие овцы Господне, которые прибились к моему „стаду“ и теперь я ваш Пастырь! Примите это и внимайте мне! Я – Сатана, и меня уже судили на Страшном суде! Все остальные суды для меня нелепы и смешны! Будете делать что я скажу, иначе я вас отсюда отправлю сразу в 7 круг ада! Никто никуда не уйдет! Либо погибнете ВЫ, либо погибнут ОНИ! Другого не дано!!»Ранее данный рассказ был опубликован в моем сборнике рассказов «Прогулка по судьбам»....
Читать онлайн
Интернет-магазин – это возможность увеличить свой доход и перейти на сторону бизнеса онлайн. Однако одних только желания и настойчивости недостаточно для достижения успеха: для уверенного движения к стабильной прибыли необходимо понимать алгоритмы создания интернет-магазина и стратегии развития бизнеса, чтобы последовательно идти к цели. Эта книга поможет вам правильно организовать работу, избегая распространенных ошибок начинающих предпринимателей....
Читать онлайн