Cloud Spanner の運用改善から学ぶ、SRE の取り組み by tkuchiki

SRE Kaigi 2025
セッション(30分)

Cloud Spanner の運用改善から学ぶ、SRE の取り組み

tkuchiki tkuchiki tkuchiki

■ 発表カテゴリ
募集要項( https://www.notion.so/srekaigi/SRE-Kaigi-2025-CfP-0939fcd968a74bddaebdbf638a957ab9 ) にある6つの発表カテゴリからお選びください

・Practices: SREの実践例と得られた教訓

■ 発表概要(400字程度)

株式会社メルペイでは、マイクロサービスのデータベースに Cloud Spanner を採用しています。
今まで、オートスケーラーやスケジュールドスケーリング機能の開発、Backup job の改善、ベストプラクティスの共有など、データベースの信頼性を高める活動を行ってきました。
それらの活動をどのような思想で行い、どのような成果を得たのかお話しいたします。

Cloud Spanner についての詳細な説明、運用上の tips など、信頼性改善の活動と関連が薄いトピックは本セッションで取り扱いません。

■ 発表の詳細(1000字程度)

  1. Cloud Spanner について(軽く)
  2. Cloud Spanner の運用における問題
  3. Autoscaler の開発と導入の効果
  4. Scheduled Autoscaling の開発と導入の効果
  5. Backup 改善の取り組み
  6. ベストプラクティスの共有

3 ~ 6 における SRE の取り組みとして、以下をお話しする予定です。

  • SRE チームの取り組みとして、Kubernetes Controllerの開発、Terraformモジュールの開発を行っている話し、それらをFinOpsと少し絡めてお話しします。
  • プロダクトチームがオーナーシップを持って運用できるようにする仕組みについて

Cloud Spanner については SRE の取り組みに関わる最低限の話しだけします。

■ 対象聴衆とその人たちが得られるもの

以下の知見を得ることができます。

  • データベースの信頼性改善を題材に、どのようなことが改善を行うことが可能で、どのような思想でそれを行っているのか
  • プロダクトチームがオーナーシップを持って運用できるようにする仕組みについて

■ なぜこのトピックについて話したいのか(モチベーション)

SREの取り組みの一つとして共有したいため。