私が所属するチームで刷新に取り組んでいる大規模レガシープロダクトは社内外問わず多くの方に利用していただいており、SLAも高く設定されていることから高水準のシステム運用とリリースサイクルが求められています。
こうした障害を許容せず、発生した場合速やかな原因特定・復旧が求められる環境において、現体制で見えてきた課題の解決とオブザーバビリティ改善に挑戦しました。 本セッションでは、その取り組みの内容をご紹介します。