サービスを運用する上で障害の発生を100%防ぐことは現実的ではありません。一方で同じ障害を頻発させていては、サービス品質の低下と運用効率の悪化につながります。そのような事態を避けるため、発生した障害について「調査・分析・対応」を行い、原因を特定し再発防止策に取り組むことが重要です。さらに、「意図的に障害を起こす」や「障害が起きたらどう動くか?」を事前に考え、対策を取る未来へ向けたアプローチも効果的です。本セッションでは、これまでの実例を交えながら、再発防止策の見つけ方や考え方を紹介します。
対象