SREがMLOpsを兼任!?小規模から始めるAI開発・運用 by 松永 祐生

SRE Kaigi 2026
セッション(30分)

SREがMLOpsを兼任!?小規模から始めるAI開発・運用

松永 祐生

■ 発表カテゴリ
募集要項(https://srekaigi.notion.site/SRE-Kaigi-2026-CfP-25a6f7392c108187a9e6e47c346396b2) にある6つの発表カテゴリからお選びください

・Future: SREの未来と新しいトレンド

■ 発表概要(400字程度)
AIって流行りだけど話題はAI活用ばかりでAIを作る話ってあんまりないですよね。

近年、AIは大きなトレンドの一つであり、需要は年々増加しています。しかし、実際にAIを構築・運用している事例はまだ少なく、特に国内ではノウハウを持つ企業が限られています。そのため、開発・運用の実態や費用が見えにくく、手を出しにくいと感じる方も多いでしょう。

当社ではSREがMLOpsを兼任するというユニークな形で開発・運用を行ってきました。本セッションでは、SREがAI基盤を設計・構築し、AIチームがモデル改善に集中できる体制を築いた方法を紹介します。役割分担の工夫、GPUコストの最適化、学習・デプロイの自動化、モニタリングまで、SRE視点での「AI開発のリアル」をお伝えします。国内で事例が少ない分野だからこそ、実践的な知見を共有します。

■ 発表の詳細(1000字程度)

  1. AI開発の大まかな流れ
    ここでは「AI開発って何やるの?」という方に向けて一般的なAI開発の流れと画像分析AIの簡単な仕組みを説明します
    ・ データ収集
    ・ アノテーション (ラベル付け)
    ・ 学習
    ・ デプロイ
    ・ 本番利用
    ・ フィードバック

  2. MLOpsの役割とSREとの責任分解点
    ここでは、AIを継続的に運用するために必要となるMLOpsの役割と、そこにおけるSREとの責任分解について説明します。MLOpsが担う「モデルをサービスとして回し続ける仕組み」の全体像を整理し、その中でインフラや運用の観点からSREが関与する具体的なポイントを取り上げます。

  3. なぜMLOpsをSREが兼任した?
    のセッションでは、当社におけるAI開発体制の特徴として、MLOpsをAIチームではなくSREが兼任している理由を説明します。一般的にはAIエンジニアやMLエンジニアがMLOpsまで担当するケースが多い中、当社ではアプリケーション開発と基盤運用を分離し、SREがインフラ・リソース管理やパイプライン構築を担う体制を選びました。

  4. SREがMLOpsを兼任するメリデメ・実際の運用を通して
    このセッションでは、SREがMLOpsを兼任する体制を取った結果、どのようなメリットとデメリットがあったのかを、実際の運用事例を通じて紹介します。

  5. おまけ (時間があれば)
    ・ 当社が作ったMLパイプラインの構成をざっと解説
    AWS Sagemaker & Label Studio

・ 実際AIサーバーの運用コストどんな感じ?
本番運用のコスト、学習のコスト、最適化について

・監視・モニタリング事情

■ 対象聴衆とその人たちが得られるもの
・ 対象聴衆
⚪︎ AI開発のリアルに興味がある方
⚪︎ 自社でAI開発を始めたいと考えている方
・ 得られるもの
⚪︎ AI開発の全体像が掴める
⚪︎ MLOpsの役割が分かる
⚪︎ 小規模から始める際の現実的なアプローチのヒントになる

■ なぜこのトピックについて話したいのか(モチベーション)
当社ではAIチームとSREチームの役割分担を工夫し、SREがMLOpsを兼任する形でAI開発を行いました。これは国内ではまだ珍しい体制ですが、非常にうまく機能しています。この体験を共有することで、他の組織でもAI開発導入のハードルを下げるきっかけになればと思い、このテーマを選びました。