财新传媒
位置:博客 > 于达维 > 金融专家与张文宏联手:用量化模型预测新冠疫情

金融专家与张文宏联手:用量化模型预测新冠疫情

1月12日,华山医院感染科主任张文宏发表文章指出,河北疫情约1个月将控制,疫苗推进速度决定未来。这个结论不仅是来自医学上的经验,更来自于他的团队和金融专家团队的合作,利用量化金融领域的模型,对疫情发展做出的预测。
 
张文宏团队和信风科技陈剑团队合作,采用基于网络关系的仿真模型,对英美目前的疫苗接种情况进行了模拟。结论是,从短期来看,应该迅速提升疫苗的接种效率,这样才能在短期内有效控制疫情的爆发式增长,否则今年全年将面临医疗挤兑的压力和新冠相关死亡人数的继续攀升。
 
模型所采用的一个重要参数是疫苗接种效率。据《纽约时报》报道,截至2020年的最后一天,美国发放的2000万支疫苗中,仅注射了280万支。实际接种人数只达到了预期接种的13%左右。按照这个速度预估,一年内的接种及获得自然免疫的人群比例在年底也只能达到30%左右,这样势必无法有效控制疫情。
 
陈剑博士介绍,上述模型采用的是智能代理人(Agent-Based Model)模型,以往在网络模拟、社会传播领域用的比较多,他们将这一模型用于预测疫苗接种对于疫情发展的影响。
 
实际上,这已经是陈剑团队把金融领域的模型应用于疫情预测的第三种模型。早在2020年2月,他就将预测信用风险的模型用于评估疫情发展趋势,准确度超越了不少传统的医学流行病学预测模型。
 
在2015年回国之前,陈剑曾担任美国安富金融工程集团董事总经理,美国联邦房贷公司(“房地美”)的信用风险及建模总监,美国花旗银行信用风险副总裁,美国国民房贷协会(“房利美”)的信用风险管理总监。
 
回国之后,陈剑创立了信风金融科技,担任创始人兼CEO,同时担任MSCI 公司亚太区高级顾问,中国资产证券化论坛信息披露专委会主席。陈剑的工作更多聚焦量化金融领域,涉及建模与预测消费者行为以及公司行为,比如消费者的还款,逾期,违约等事件。
 
疫情之前,信风科技的大部分工作是帮MSCI开发中国消费贷款的ABS模型。武汉疫情出现之后,陈剑发现当时许多国外所用的预测都是基于传统的SIR模型,或者是其扩展的SEIR模型。这种模型有很明显的缺点,主要是对参数的敏感性特别强:参数稍微有调整,预测的结果就会出现很大的误差范围。从当时国际几篇顶级期刊发表的论文可以看出,这些传统模型预测的准确性和稳定性是不够的。
 
陈剑认为,传统的疫情预测模型存在很大的缺陷,西方对中国的预测出现很大失误,最大问题是把已知疾病模型运用到一个未知的传染病,而且没有考虑中国能用强力控制措施直接切断传染的路径。
 
陈剑称,预测消费者信用风险的模型和预测疫情风险有一定相通之处。“我们希望把它的思路、角度,借用其他的数学工具运用到流行病防控中。”
 
从2020年2月6日开始,陈剑团队利用量化金融领域评估信用风险的转移矩阵模型预测疫情风险。这个模型对于消费贷款从正常贷款,到轻度逾期到严重逾期,到违约的事件链条,与正常人与传染源接触,成为密切接触者,以及之后的轻症、重症、危重症乃至死亡的事件链条有非常高的相似性。
 
这个模型首先在湖北做了应用,预测结果中的几个主要指标,包括总感染人数、危重症人数、疫情受控的时间节点,准确性很高,被上海赴武汉医疗队长郑军华院长团队和上海疫情防治组长张文宏主任团队正式采用。后来这个模型也给西欧几个主要疫情国家使用,在对意大利疫情的模拟中,第一波疫情峰值的天数预测只差了一天,峰值的新增感染人数预测误差只有1%左右。
 
陈剑说,当时有境外专家预测,上海二月底会有80万人感染,实际只有300多人。当时张文宏教授就说,以前都是外国专家对我们的疫情防控指指点点,现在我们可以指导他们,而且我们预测得更准。
 
陈剑介绍,意大利科学家做的基于传统SIR框架的预测模型,误差非常大。而转移矩阵这种马尔可夫模型,对于参数不是那么敏感,可以运用许多经验概率。如果完全由估计的参数驱动,模型就会有可能不稳定,信风的就避免了对参数的依赖。
 
陈剑团队发现,疫情发展的主要驱动因素在于“非医学干预”的力度,这个因素对于预测结果的影响非常大,“模型已经告诉我们应该做什么,关键在于各国政府愿意不愿意做。”
 
后来陈剑团队开始与张文宏团队合作疫情指数。2020年7月31日,全球新冠疫情风险指数正式发布。指数由信风科技陈剑博士团队进行算法研制及开发,张文宏教授团队提供医学咨询,财新数据科技有限公司提供疫情相关底层数据支持,安谷医药科技提供网站开发技术支持。
 
从2020年8月开始,他们在 财新网发布疫情指数周报
 
陈剑介绍,疫情指数利用的是金融领域构建股票指数的一些方法。用加权平均方法来综合衡量风险维度。为各国各地区重新开放提供决策依据,为重新开放人员、货物交流提供参考,对于任何一个国家及地区,要重新开放边界,就需要了解全球各个国家地区,哪些属于高风险,哪些属于低风险,这样才能做到有的放矢,精准防控。
 
文章开头所提到的,两个团队对美国疫苗接种对于疫情控制效果的预测,使用的模型,叫做智能代理人决策模型,根据美国人口,地区的差别,年龄分布,疫苗的产能、发放、运输链条,进行疫苗接种预测,最终疫苗接种的水平,综合自然免疫的结果,就决定了人群整体免疫的水平。
 
2020年11月初,陈剑团队和张文宏团队开始研发新冠疫苗交付模型,以预测疫苗交付政策对于未来各国疫情发展的影响。这是他们继疫情预测模型,全球疫情风险指数之后合作的第三项主要项目。
 
12月13日,他们发布预测指出,如果拜登政府的百日疫苗接种计划能够顺利实施,而且民众接种意愿超过50%,那么疫情有望在2021年6、7月份得到控制; 如果实施不顺利,或者民众接种意愿不充分,那么疫情要到秋季才能被控制,甚至会绵延到2022年春季。根据模型预测结果,他们建议,美国新政府如果想迅速控制疫情,不但要做好疫苗采购、供应链管理、疫苗交付,还需要做好民众的接种教育。
 
陈剑介绍,这个模型和以前不同,这是一种仿真模型,而不是以前的转移矩阵模型,很多决策变量可以调整,例如疫苗产能、接种效率,接种意愿、在实际情况中都会出现变化,对于仿真的节点和仿真的路径要求比较高,很大的约束是算力不够。
 
2021年1月13日,陈剑团队与华为云达成了合作,后者愿意为疫情模拟提供算力支持。利用华为云的资源,仿真的结果会更加准确,效果会更好。可以根据实时的疫苗接种情况,预测疫情的发展。
 
陈剑说,之前也没想过,这些模型会用到传染病学领域,但他的博士专业的就是管理科学、运筹学,属于应用数学的一个分支,本身就可以用在各个领域。很多计量经济学的方法,比如存活性分析,Cox风险模型,最早也是从医学领域借鉴到金融、经济领域。把计量经济学的方法用于疾病防治,也可称得上是经济学界对于医学界的感恩和反哺。



推荐 11