AWS NeuronでLLMはどこまで戦えるか?推論・ファインチューニング・コンパイルの壁 by 小島 啓明

JAWS DAYS 2026
セッション(20分)

AWS NeuronでLLMはどこまで戦えるか?推論・ファインチューニング・コンパイルの壁

小島 啓明
2

生成AIの実装において、GPUコスト高騰への解として期待される「AWS Neuron(Trainium/Inferentia)」。本セッションでは、その実戦投入の可能性を徹底解説します。

本セッションでは、コスト効率に優れたこのチップを使い倒すべく、徹底的な検証結果を共有します。 単なる推論だけでなく、モデルごとのコンパイルの境界線、ファインチューニングの実践、オブザーバビリティ確保など、泥臭い検証結果を共有。さらにre:Invent 2025の最新機能も速報的に検証します。

インフラエンジニアには「コスト最適化の現実解」を、MLエンジニアには「AWS特化チップの攻略法」を。両視点からNeuronの"現在地"を解き明かします。

以下のテックブログのNeuron関連の内容を、エッセンスと最新の検証結果を凝縮してお届けする予定です。

https://zenn.dev/p/exwzd