■ 発表カテゴリ
募集要項( https://www.notion.so/srekaigi/SRE-Kaigi-2025-CfP-0939fcd968a74bddaebdbf638a957ab9 ) にある6つの発表カテゴリからお選びください
・Future: SREの未来と新しいトレンド
■ 発表概要(400字程度)
Datachainは、より多くの資産が様々なブロックチェーンネットワークでデジタル化される時代に向けて、インターオペラビリティ(相互運用性)を「技術」によって実現し、世界をあたかもひとつのネットワークとして扱えるインフラを開発しています。
現在、これまでのR&Dの成果を活かし、グローバルな取引の常識を変える下記の二つの事業に取り組んでいます。
この発表ではクロスチェーンブリッジを実現するTOKIを具体例に、ブロックチェーン x R&D x SREというまだ事例の少ない領域におけるSRE実装事例をご紹介します。
■ 発表カテゴリ
Case Studies: 実際の導入事例や失敗談
■ 発表概要(400字程度)
Flatt Securityは「エンジニアの背中を預かる」をミッションに、開発組織におけるセキュリティを支援しています。
中でもAWS等クラウドのセキュリティ運用においては、セキュリティ機能を有効化しているものの運用体制が形骸化してしまう、人的・時間的リソースが限られており運用が難しいなどの課題も多くいただきます。
本セッションでは、Flatt Security CTOの米内が、FindyにてSRE組織の立ち上げからAWSのセキュリティ体制構築を推進されている安達氏に、Findyが直面するAWSのセキュリティの課題をどう解決しようとしているか。脆弱性診断SaaS「Shisho Cloud」を活用した取り組みや今後の展望を伺うことで、SRE組織がAWSセキュリティに取り組む際の第一歩について考えます。
■ 発表カテゴリ
募集要項( https://www.notion.so/srekaigi/SRE-Kaigi-2025-CfP-0939fcd968a74bddaebdbf638a957ab9 ) にある6つの発表カテゴリからお選びください
・Culture: SRE文化の醸成と組織変革
■ 発表概要(400字程度)
1年半前、開発部内ではSREがインフラ専任の役割という印象がありました。しかし、そこからEmbedded SREとして開発チームと連携し、SREの文化を浸透させる取り組みを始めました。その後、全社のSREから独立した、開発部のSREチームを立ち上げ、オブザーバビリティの導入やインフラ管理のイネイブリングを進めてきました。また、システムの信頼性を高めるためにSLI/SLOを導入し、開発と運用の両面から品質向上に取り組んできました。本発表では、これまでの取り組みの成果と課題、そして今後の展望についてお話しします。
■ 発表カテゴリ
募集要項( https://www.notion.so/srekaigi/SRE-Kaigi-2025-CfP-0939fcd968a74bddaebdbf638a957ab9 ) にある6つの発表カテゴリからお選びください
・Tech: SREを支える具体的な技術や手法
・Practices: SREの実践例と得られた教訓
・Architecture: SREの視点からのシステム設計
・Culture: SRE文化の醸成と組織変革
・Future: SREの未来と新しいトレンド
・Case Studies: 実際の導入事例や失敗談
■ 発表概要(400字程度)
SREの提唱をきっかけにポストモーテムカルチャーが浸透しはじめ、個々のインシデントに対する改善が進みつつあります。一方で、インシデント対応のプロセス全体の改善にはなかなか着手できていない組織が多いのではないでしょうか。
本講演では、データドリブンなアプローチを用いたインシデント対応プロセスの改善手法について解説します。
具体的には、ベストプラクティスに基づてインシデント対応プロセスにおける各マイルストーン(発生→検知→認知...)を整理し、各フェーズ間でのTTXメトリクスの活用方法を説明します。
また、システムの迅速な復旧だけでなく、組織間の連携や顧客とのコミュニケーションも重要であることにも触れながら、インシデントコマンダーやコミュニケーション担当(Liaison)など、さまざまな役割にも焦点を当てつつ、組織全体のインシデント対応能力を向上させるためのアプローチを提案します。
■ 発表カテゴリ
募集要項( https://www.notion.so/srekaigi/SRE-Kaigi-2025-CfP-0939fcd968a74bddaebdbf638a957ab9 ) にある6つの発表カテゴリからお選びください
・Practices: SREの実践例と得られた教訓
■ 発表概要(400字程度)
スタートアップでは、生き残りをかけて機能開発のスピードが最も重要視されます。
そのため、弊社においてもデプロイフローの改善は後回しにされ、急成長期におけるビッグバンリリースが大きな足枷となってしまいました。
事業が拡大しプロダクトやチームが増えていく中で、リリースの頻度を上げるための技術的課題やチーム間の調整問題など様々な障壁に直面しましたが、綿密な計画とチーム全体の協力を通じてこれらを解決してきました。
本発表では、具体的にどのようなステップを踏み、どのような工夫を行って理想的なリリース体制を構築したのか、そしてその過程で得た教訓や成功のポイントについて詳しくご紹介します。
■ 発表カテゴリ
・Tech: SREを支える具体的な技術や手法
・Practices: SREの実践例と得られた教訓
■ 発表概要
複数のAWSアカウントを運用する上では、サービスを横断したアラートの管理やコストの可視化、そして運用効率の向上が求められます。
メタップスのSREチームは、コスト最適化の観点から、ログとコストを統合的に可視化できるダッシュボードを開発しました。
本登壇では、その開発背景とアーキテクチャ、具体的な活用事例について紹介します。
■ 発表カテゴリ
・Practices: SREの実践例と得られた教訓
■ 発表概要(400字程度)
「SplunkとObservabilityを活用したSREの未来:データドリブンなシステム運用」では、SREにおけるデータ活用の重要性とその未来像について解説します。私の今までのキャリアでのコンテナ運用やSplunkを用いた経験をもとに、インシデント対応を効率化し、信頼性向上に貢献した実例を紹介します。また、SLOやSLIを用いた顧客体験の改善方法や、Splunkを活用したインシデントの根本原因分析、自動化対応の進展も取り上げます。さらに、データドリブンなアプローチが顧客満足度向上にどのように寄与するかを探り、SRE業務の未来におけるSplunkの役割を展望します。
■ 発表の詳細(1000文字程度)
本セッションでは、SREにおけるデータ活用の重要性と、それがどのようにしてSRE業務に変革をもたらすかについて具体的な事例とともに解説します。データに基づいた意思決定とインシデント対応は、SREにおける信頼性向上の核となる要素であり、サービスの安定運用に不可欠です。このセッションでは、私のこれまでのSplunkを用いたキャリアでの経験と、現在Splunkでお客様の活用を支援している立場から、データドリブンなSRE手法を探っていきます。
具体的には、Splunkのログ管理やSplunk Observabilityのモニタリング機能を活用して、どのようにシステムのパフォーマンスを監視し、インシデントを予測・回避するかを説明します。また、実際の障害発生時やリリース時にSplunkを活用した迅速な対応方法についても紹介し、データに基づく対応がインシデントの影響を最小限に抑え、サービスの信頼性を向上させる方法を共有します。さらに、SLAやSLOの重要性、データ活用による効率化と自動化の進展についても触れ、顧客体験を向上させるデータ活用法を解説します。また、SLA/SLOの明確な設定は、サービスの品質を定量的に評価し、エンドユーザとの透明なコミュニケーションを促進する鍵です。これにより、エンドユーザとの信頼関係構築と満足度向上の戦略を共有します。
■ 具体的には以下のようなアジェンダを企画しています。
■ 対象聴衆とその人たちが得られるもの
Splunkの活用に興味がある方や、データドリブンなSRE業務に関心がある方にとって、Splunkを活用した新しいSREのアプローチや、インシデント対応・顧客満足度向上に役立つ具体的な手法を学べます。
■ 発表カテゴリ
・Tech: SREを支える具体的な技術や手法
■ 発表概要(400字程度)
コード化されていない稼働中のサーバを移設/再構築する必要が出てきたことはないでしょうか?私はこれまで4度ほど経験してきました。この経験を通じて、手動設定が多いシステムや長期間運用されているサーバの移設/再構築がいかに難しいかを実感しました。
現代のIT運用では、インフラのコード化(IaC)が主流ですが、すべてのサーバがコード化されているわけではありません。本セッションでは、コード化されていない稼働中のサーバを安全かつ効率的に移設するための技術と手法について解説します。今後の長期に渡るインフラ運用を見据え、移設後の最適化と信頼性に関する考察や実例を交えながら、具体的な移設方法を共有し、参加者が今後のシステム運用を行う上での一助となることを目指します。
■ 発表カテゴリ
・Culture: SRE文化の醸成と組織変革
・Future: SREの未来と新しいトレンド
■ 発表概要(400字程度)
みなさんのSREとの日々は、納得感を持って進められていますか?SREは今や、業種業態問わずシステムの信頼性を高めるための重要なポジションとしての認識が広がり、実践例が増えていますよね。多くの方は満足感・納得感を得ながら仕事をできていると思います。ですが、中にはもしかすると「なにか思っていたのとは違うな」と感じている方もいるかもしれません。その違和感は、もしかすると信頼性と生産性のバランスの違いから来ているのかもしれません。
ソフトウェアエンジニアリングを元に運用を改善していくSREは、信頼性と生産性の両方にアプローチできます。それはとても良いことなのですが、その2要素は場合によっては相反することもある概念です。SREのプラクティスは信頼性を高めることにプライオリティがおかれているため、生産性のほうに興味が強い方には、もしかすると違和感を覚えることもあるかもしれません。
そんな中で出てきたのかPlatform Engineeringです。生産性を高めることにフォーカスしたこの分野は、SREと似ているポイントもあれば、異なる部分もあります。本セッションでは、その違いに着目しながら、キャリアとしてのPlatform EngineerとSREを分ける要素は何なのか、みなさんがどちらに向いているのかを判断するためのエッセンスとキャリアについてお話します。