■ 発表カテゴリ
■ 発表概要(400字程度)
サービスの信頼性担保にはSREsと開発チームの連携が欠かせません。
連携には様々な実践方法がありますが、千株式会社のはいチーズ! フォト EC開発チームにおいては、横断SREチームからメンバーを受け入れ、Embedded SREを新たに実践しました。
このセッションでは、弊社におけるEmbedded SREの導入から継続について、SREのめがたと開発チームのササキ、それぞれの視点からお話します。
具体的には、以下のような内容を話します。
■ 発表の詳細(1000字程度)
以下のような内容を予定しています。
まず、発表タイトルにもあるEmbedded SREについて、その役割や他のSREとの違いを簡潔に説明します。
次に、開発チームと横断SREがそれぞれ直面していた信頼性の課題を紹介します。これらの課題がなぜ生じたのかを含め、Embedded SREを採用した理由を詳しく説明します。
セッションの中盤では、Embedded SREの導入と継続について、我々のチームでの取り組みを共有します。具体的な取り組みとして、SLI/SLOについてのワークショップの実施や、OpenTelemetryを用いたオブザーバビリティ導入によるアラートと障害対応の改善、そしてTerraformを活用した開発チームによるAWSリソース管理の実現など、個別の取り組みを紹介しながら、どのようにしてSREの概念をチームに導入し、全員で継続しているかについて話します。
最後に、Embedded SREの導入におけるメリットとデメリット、そしてどのようなチームにこのプラクティスが適しているかを考察し、セッションをまとめます。
■ 対象聴衆とその人たちが得られるもの
このセッションでは、以下のような人たちを想定としています。
セッションを聞いた方が、以下のことを持ち帰られるような発表を準備しています。