ある日セールスから、とあるエンタープライズ企業のトライアルが始まることを知らされました。嬉しい知らせでしたが、詳細を聞いてみると対象のテナントは従来のテナントと比べて50倍以上のデータ規模であるということが判明します。
ISUCONのように既存リソースを極限まで最適化し、解決することが理想です。しかし実際の運用では、「サービスを止められない」、 「データの欠損は許されない」 など運用上の制約があり難しい場合があります。
一方でスケールアップやリソースの追加といった、お金をかけて解決する選択も実際の運用中では有効なオプションとなり得ます。 また、スピードを優先することで長期的には技術的負債になり得そうな選択肢を取ることも出てきます。
本発表では、アプリケーション、バッチジョブ、インフラ に渡って トライアルから本契約に至る過程で直面した"急"な大規模データリクエストにおいて、どのような対策を事前にとったのか、どのような問題が起こったのか、どのように解決していったのかを紹介します。
この発表を通じて、制約下でどうスケールアップ/リソース追加を選択し改善を重ねたかを共有し、急な要求に直面した際の一つの参考事例になればと思います。