大幅リニューアル後に、放置していたクラッシュが、なんと一日数千件まで爆発してしまった!?しかもそれは再現方法も原因の手がかりもまったくつかめないクラッシュなの?
結論から書くと原因はメモリ不足でした。メモリ不足によるクラッシュは直接の原因がログやスタックトレースに現れないので再現が容易でなく調査が困難です。
このトップクラスのクラッシュに対して、クラッシュログから原因を推測し、メモリ不足と仮定して、Allocationsで調べながら、リファクタリングを行いました。そしてリリースしたバージョンを観測した結果、無事解決できていることが分かりました!
このLTでは、このような再現手段がない、特定ができない問題について、どのように仮説を立てて、解決していったのかを紹介します。