Enabling SREからEmbedded SREへの転換 by ササキ

SRE Kaigi 2025
セッション(30分)

Enabling SREからEmbedded SREへの転換

_kei_s ササキ _kei_s
2
このトークはスピーカー都合でキャンセルになりました

■ 発表カテゴリ

  • Case Studies: 実際の導入事例や失敗談

■ 発表概要(400字程度)
サービスの信頼性担保にはSREsと開発チームの連携が欠かせません。
連携には様々な実践方法がありますが、千株式会社のはいチーズ! フォト EC開発チームにおいては、横断SREチームからメンバーを受け入れ、Embedded SREを新たに実践しました。
このセッションでは、弊社におけるEmbedded SREの導入から継続について、SREのめがたと開発チームのササキ、それぞれの視点からお話します。

具体的には、以下のような内容を話します。

  • Embedded SREとは何者か
  • なぜEmbedded SREを手法として採用したのか
  • Embedded SREを始める
  • Embedded SREを続ける
  • Embedded SREのメリット・デメリット

■ 発表の詳細(1000字程度)
以下のような内容を予定しています。

  • Embedded SREとは何者か
  • なぜEmbedded SREを手法として採用したのか
    • サービスが抱えていた課題
    • 開発チームが抱えていた課題
    • 横断SREが抱えていた課題
    • 他のSREプラクティスとの比較
  • Embedded SREを始める
    • 開発チームに入りこむ
    • SREを受け入れるための開発チームの準備
  • Embedded SREを続ける
    • 役割ではなく活動としてのSREを浸透させるための活動
  • まとめ
    • Embedded SREとして活動してのふりかえり
    • Embedded SREのメリット・デメリット
    • どんなチームにEmbedded SREがおすすめか

まず、発表タイトルにもあるEmbedded SREについて、その役割や他のSREとの違いを簡潔に説明します。
次に、開発チームと横断SREがそれぞれ直面していた信頼性の課題を紹介します。これらの課題がなぜ生じたのかを含め、Embedded SREを採用した理由を詳しく説明します。
セッションの中盤では、Embedded SREの導入と継続について、我々のチームでの取り組みを共有します。具体的な取り組みとして、SLI/SLOについてのワークショップの実施や、OpenTelemetryを用いたオブザーバビリティ導入によるアラートと障害対応の改善、そしてTerraformを活用した開発チームによるAWSリソース管理の実現など、個別の取り組みを紹介しながら、どのようにしてSREの概念をチームに導入し、全員で継続しているかについて話します。
最後に、Embedded SREの導入におけるメリットとデメリット、そしてどのようなチームにこのプラクティスが適しているかを考察し、セッションをまとめます。

■ 対象聴衆とその人たちが得られるもの
このセッションでは、以下のような人たちを想定としています。

  • Embedded SREとしての取り組みをこれから始めるSRE
  • Embedded SREをこれからチームに迎える開発者
  • Embedded SREを導入するか検討している人

セッションを聞いた方が、以下のことを持ち帰られるような発表を準備しています。

  • Embedded SREの視点から
    • 開発チームに入るまでにやってよかったこと・いまいちだったこと
    • 他のSREの実践方法との比較
  • 開発チームの視点から
    • 開発チームに入ってもらうまでに準備しておくこと
    • Embedded SREが開発チームにもたらすもの