大数据战“疫”——多源大数据疫情防控研判系统
3月24日,北京大学收到了来自国家外交部的一封感谢信,信中感谢北大党委和行政领导对战“疫”科研工作的重视和大力支持,感谢北大信息科学技术学院王腾蛟教授、陈薇副研究员科研团队:在新冠肺炎疫情期间集中攻关,连续奋战,开发了基于多源大数据集成学习的国际疫情发展研判系统(PESA-Global),并依据该系统连续多次精准预测了国际疫情趋势。有关成果由外交部定期组织上报中央,得到中央领导的高度认可和肯定,为辅助中央领导决策发挥了重要的参考作用。
这距离王腾蛟团队接到用大数据战“疫”的科研任务已近2个月。回首今年1月底以来持续科研攻关的日日夜夜,王腾蛟深有感触:“大数据是一门应用技术,作为科技工作者,我们既要努力科研创新,又要重视工程实践,让技术更好地服务社会,为疫情防控提供坚强有力的科技支撑。”
争分夺秒 以智战“疫”
今年1月底,突如其来的新冠肺炎疫情给新春佳节蒙上了一层阴影。此时,王腾蛟团队接到学校一项紧急任务安排:发挥团队在大数据分析技术方面的优势,立即投入大数据疫情防控研判系统的研发,为疫情研判服务!王腾蛟说:“从那时开始,我们团队的老师和同学们闻令即动、争分夺秒,立即进入了全力以赴的科研攻关状态。”一场大数据对垒疫情的科研攻坚战就此展开。
“由于疫情的突发性和高传染性,原有数据统计和分析方式存在来源单一、覆盖面小、缺少综合研判机制等问题。”为了与疫情拼速度,及时掌握真实全面的疫情数据并对这类数据进行高效的分析和准确的趋势预测,王腾蛟带领团队中的老师和同学们集中攻关、连续奋战,“在大家的通力合作下,我们团队迅速研制开发出多源大数据疫情防控研判系统(Pneumonia Epidemic Situation Analyst ,PESA)。”系统采集多种来源的数据,包括全球疫情每日发布信息、疫情相关网络舆情信息、各国疫情环境数据等,通过疫情分析因素提取方法,从采集的多源数据中提取出用于疫情发展研判的因素数据。各个来源的数据和预测模型相互独立又互相补充,最终通过多个预测模型的集成学习,生成对疫情发展的多维度研判结果。“通过采集多重来源的数据,最终由计算模型来综合形成完整的结果,服务于国家有关部委研判国内疫情发展态势,为我国疫情防控指挥和部署提供科学有效的决策支持。”王腾蛟介绍。
追踪形势 深度开发
3月以来,在国内疫情防控形势积极向好的同时,疫情在全球快速蔓延。积极稳妥地做好应对海外输入风险工作,坚决维护好前一阶段来之不易的疫情防控成果,成为我国当前最重要的任务。王腾蛟团队中的老师和同学们及时追踪疫情形势的发展,开发了基于多源大数据集成学习的国际疫情发展研判系统(PESA-Global),并依据该系统对国际疫情发展态势做出预测和研判,每天上报一次《疫情预测日报》,每周上报一次《疫情防控政策研判报告》。
国际疫情发展研判系统的精准预测获得了国家有关部委的“点赞”,在感谢信中写道:“王腾蛟教授、陈薇副研究员团队的科研成果,体现了团队卓越的科研创新能力和坚实的工程实践能力,也体现出北京大学围绕国家重大战略需求开展科学研究和社会服务的精神。”
“云化”科研 突破阻碍
疫情阻断了团队中同学们回校的脚步,科研过程中的沟通问题如何解决?团队采取了“云化”科研的方式,突破时空的阻碍,加快科研的进度。团队中的老师和同学们采用云会议方式每天进行工作讨论;采用协同开发环境,异地完成系统代码的团队开发工作……工作沟通搬到了“云端”,工作效率并没有受到影响,国际疫情发布的数据库、国际疫情舆情的数据库、各国疫情环境的数据库、中国疫情的历史与演化模型的数据库迅速建立起来,“有了这些数据库,就给我们数据研判提供了很重要的基础”。随后,团队通过因素提取,在大量数据中提取可能影响疫情的病例数据、医疗条件、设备环境、自然环境等因素,建成多源集成学习模型,并进而成功研发了精准预测疫情的多源大数据疫情防控研判系统。
回望这段时间的集中科研攻关,王腾蛟深感由于新发重大传染病的突发性和高传染性,疫情预测工作缺乏累积数据和有效分析手段,因而大数据引导机制显得尤为重要。“我们团队下一步拟深入开展基于大数据的新发重大传染病监测、预警方法和系统研究工作,设计科学有效的大数据引导机制,为我国卫生防疫工作的开展提供有力的大数据决策支撑。”
国际疫情发展研判科研团队核心成员包括:王腾蛟教授、陈薇副研究员、博士后常一鸣、博士生高翔、博士生王鹤媛、硕士生王朝和硕士生韩愉等。
延伸 · 阅读
- 2015-12-14互联网+时代大数据助力产业重塑竞争力微信课堂成功举办
- 2015-12-27基于中国大数据的市场洞察和管理启示
- 2016-01-15会员大数据智能清洗方案
- 2016-04-14预告:2016云栖大会深圳峰会大数据专场
- 2016-04-20大数据应用电子商务之精准推广