失敗を糧に、SLOを共通言語へ -役割を超えて信頼性を向上させていくための理論と実践 by VTRyo

SRE Kaigi 2026
セッション(30分)

失敗を糧に、SLOを共通言語へ -役割を超えて信頼性を向上させていくための理論と実践

3s_hv VTRyo 3s_hv
1

■ 発表カテゴリ

・Tech: SREを支える具体的な技術や手法
・Practices: SREの実践例と得られた教訓
・Culture: SRE文化の醸成と組織変革
・Case Studies: 実際の導入事例や失敗談

■ 発表概要(400字程度)

本セッションは、SREという役割を超えた関係者も理解を進められるよう、
SLOの基礎から、なぜ多くの人を巻き込んで取り組む必要があるのかまで解説します。

SLO導入・運用に失敗する多くのケースは、技術そのものではなく、
認識齟齬や会話不足が原因です。「とにかく高いSLO維持を求められている」「SLOの数値が現場の感覚とズレている。だんだんルールを守るのが難しくなってきた」「一度決めたSLOを見直すのは難しい」「開発スケジュールとの関係でうちではSLOを扱えない」──こうした状況がなぜ生まれるのか、
具体例で示します。

その上で、「SLO サービスレベル目標」などの理論と、実際の失敗例・成功例を交えながら、アンチパターンを避け組織に浸透させる方法をお伝えします。参加者は、明日からの一手を持ち帰れます。

■ 発表の詳細(1000字程度)

これまで経験してきた組織で、SLOの導入や運用をいくつも担当してきました。
そこでわかったのは、どの組織も導入とその運用の継続に難しさを感じているということです。

終わりのない取り組みであるため、様々な課題が発生します。
・何をどこまでやるべきなのか不明
・SREだけで進めていいのか不明
・導入したものの、SLOがレビューされずに過去のものになってしまった
・現場と設定されたSLOにズレがあるのではないか
・責任者から常に高いSLO維持を求められている
・開発者やサービス責任者にまちがって伝わっているのではないか

他にも心当たりがあるかも知れません。
SLOは、SREがまず初めに取り組むプラクティスとして有名ですが、なぜこんなにも難しいのでしょう?

その一つに、SLOに対する認識の齟齬があると考えています。
信頼性を向上していくためには、SREという役割を超えて会話をしていく必要があるのです。

本セッションでは、SLOについて関係者が理解できるように解説しながら、理論と過去の例を交えて解決策を提供していきます。

理論については、「SLO サービスレベル目標」を引用しながらベストプラクティスについて考えます。
SLOを決めていく際の基準(メトリクスから厳密に決めていくパターン、現場の肌感から決めていくパターン)や、関係者をどのように巻き込むかなど、学術的な側面からもアプローチします。

過去の例では、うまく行かなかった例(他チームからの反発、SLOそのものの信用が低減したなど)や、比較的スムーズに導入できた例(各チームが積極的に取り組んでいる、振り返りしているなど)を紹介しつつ、どう理論を落とし込めば良いかをお話しします。

このセッションを聞くことで、明日から次の一手をどう進めるか持ち帰れるような内容をお話致します。

■ 対象聴衆とその人たちが得られるもの

【対象聴衆】
・SRE初心者:理論的基礎から学びたい方
・SRE経験者:組織浸透に課題を感じている方
・開発者:SLOとの向き合い方を知りたい方
・マネージャー:SLOの価値を理解し活用したい方

【得られるもの】
・SLOに関する誤解。その解消方法
・導入・運用失敗のアンチパターンとその回避策
・効果的な進め方

登壇資料は、社内での関係者説明にも活用できるように意識します

■ なぜこのトピックについて話したいのか(モチベーション)

複数の組織でSLO導入・運用を経験する中で、その難しさを痛感してきました。
多くの立場の違う人が関わる重要な取り組みであるため、巻き込む人が多いほど困難になっていきます。

しかし、この課題は技術的な問題ではなく、認識の齟齬や会話不足という組織的な問題です。つまり、解決可能な問題だと考えています。

私はこの問題が解決されることで、業界全体の信頼性がより向上すると信じています。理論と実践を組み合わせた内容を提供することで、参加者の皆さんがSLOに取り組む際の検討の第一歩になれたら、これほど嬉しいことはありません。

また、このセッションが「SREだけの問題ではない」という認識を広め、より多くの人がSREの実践に参加できる土壌を作ることにも貢献したいと考えています。