来源:李迅雷金融与投资(微信公众号 lixunlei0722)
2020年2月3日,是新冠疫情爆发后开市第一天,伴随着每日确诊病例数呈指数级增长,恐慌情绪充斥在各类资讯中,上证综指以接近跌停开盘,当天,我们发布了《疫情拐点何时出现——基于数学模型的新冠病毒传播预测》,基于经典的SEIR流行病传播模型对国内疫情做出了预测,结论是“预计未来总患病人数将达到88500人(中性假设下),新增确诊人数将在2月17日(中性假设下)左右出现拐点 。”从事后看,中性假设下的预测结果与实际情况非常接近 。后来,我们对海外疫情的发展也做出了跟踪预测,都取得了不错的效果 。
在一年后的今天,中国内地在经历几个月本土几乎零新增病例后近期又出现了一些零散的疫情传播,欧美国家不少地区仍在最高级别的封锁措施下,那么全球疫情的拐点何时出现?本文先回顾之前对国内外疫情预测的主要逻辑,再对未来疫情的发展做出预测 。
核心观点
1)相信逻辑,坚持从模型的逻辑出发,校验和提升输入模型的数据质量比增加模型本身的复杂度和精度更重要 。
2)紧紧围绕防疫措施(包括疫苗接种)对传染系数R0(基本再生数)的影响,来评估和预测疫情的发展,是取得较好预测效果的关键 。
3)海外很多国家已感染人数可能明显大于累计确诊数,离达到群体免疫拐点的距离可能没有那么远 。
4)随着疫苗接种的提速,美国大概率在6月前(乐观假设下4月份)能达到群体免疫 。
5)欧美国家采取封锁措施的强度很大程度上取决于医疗系统的压力,因此在对老年人等重点人群疫苗接种达到较高比例后,重症率和死亡率会明显下降,即使新增确诊人数上升,医疗系统的压力也会缓解,封锁措施可能提前解除 。
历史回顾:相信逻辑是取得预测效果的基本前提
回顾过去一年对国内外疫情预测取得的一些效果,如果要总结一点经验的话,就是要相信逻辑,坚持从模型的逻辑出发,而不能被恐慌情绪左右,也不能简单套用模型 。事实上,这一经验在投资领域的各种预测中都是相通的 。下面通过回顾疫情预测中几个具体的问题,可以更直观的理解坚持从逻辑出发的重要性 。
估算新冠病毒的初始R0值
初始R0值是指病毒在最开始还没有人为的防控措施的情况下,平均每个病人能传播几个人 。估算这一数值非常重要,因为模型预测依赖这个初始参数,包括采取防疫措施后R0能下降到什么水平,也与初始的R0值非常相关 。
在2020年2月3日发布的《疫情拐点何时出现——基于数学模型的新冠病毒传播预测》中,估算的新冠病毒的初始R0为5.38,明显大于SARS(3左右) 。当时还是受到不少质疑,因为当时各类研究和资讯大多是说新冠病毒的传染系数可能接近SARS 。
实际上,用SEIR模型测算R0值的方法是确定的,问题是输入什么数据来测算 。从逻辑上讲,疫情初期没有采取额外的防疫措施,检测手段和检测覆盖面都是严重不足的,所以初期的确诊数据可能失真(来不及检测) 。如果输入初期的确诊数据,即使模型精度再高,也得不到较准确的结果 。
当时,我们采用了相对另类的数据:从武汉迁出到外省的人群的发病率反推当时武汉的疫情规模 。因为在疫情前期,武汉的医疗资源紧张,检测能力严重不足,但春节前迁移到外省的人群,都得到了充分的观察和检测,数据不容易失真 。
图表1 从武汉迁出人口最多的8省市累计确诊数据
