iOS稳定性问题治理-笔记

最近参加ArchSummit，听字节APM线分享iOS的OOM和Watchdog等问题的治理，刚好工作也相关，收获不少，做个笔记

OOM

OOM问题没有明确调用栈，也很难复现，字节解决方法是MemoryGraph

常见原因：

方法;

一般排查卡顿的确也会考虑定期从寄存器抓取线程堆栈，维护一定时间区间内的栈信息（毕竟卡顿时刻的堆栈并不一定是原因所在，所以需要是区间），再检测到卡顿时上报到后端，辅助排查。不过就是要注意性能开销，，免得检测工具本身反而成为影响性能的原因。

常见原因:

方法：

生成coredump（常见操作，没啥好说的，有当前时刻的完整运行状态）
iOS线上开启Zombie Object，就是OC对象销毁hook掉，生成僵尸对象，只要野指针指向僵尸对象，再次访问就会崩溃在那里，这样就能拿到真正的错误现场（值得注意的是，这里相当于内存没有回收掉，某种意义上的内存泄露，所以线上开启时必须要对对象的数量有限制）

基于MetricKit框架获取处理（我只是一个小服务端，不大了解苹果这框架，就酱）