当前,新冠病毒(dú)肺炎疫情在(zài)国内已经得到(dào)有效控制,复工复产正在(zài)全面(miàn)推(tuī)进(jìn)之中。那么,目前经济(jì)复苏的情况(kuàng)究竟如何(hé)?各(gè)行各业以及各地区(qū)的发展(zhǎn)形势有(yǒu)何差异(yì)?百(bǎi)度公(gōng)司最(zuì)近发布的2篇(piān)论(lùn)文 [1, 2] 研究(jiū)发现,这些(xiē)答案,都“藏”在海量的大数(shù)据(jù)里。
研究表明,百度(dù)地图的用户和商户数据情况与GDP走势呈现高(gāo)度相关性(xìng),成为呈现行业(yè)和地区(qū)经济(jì)复苏情况的“晴雨表”。同(tóng)时,百度地图、搜(sōu)索和健康平台的数据显示(shì),某一(yī)地区人口流动情况(kuàng)以及(jí)搜(sōu)索习惯,与(yǔ)该地(dì)区(qū)的(de)疫情形势紧密相关。由(yóu)此可见(jiàn),百(bǎi)度多维(wéi)度大数据能(néng)够有效地(dì)为(wéi)疫情(qíng)发(fā)展及其社会影响(xiǎng)“画像”。
中国(guó)传(chuán)媒大学调查(chá)统计研究所所长、大数据挖掘与社会计算实验室主任沈浩表示,在抗击新(xīn)冠肺炎疫情的斗争中,全国各地的政府、企业和科研(yán)机构都在探索运用大数据手(shǒu)段(duàn)提升(shēng)治理能(néng)力、加强抗疫(yì)效(xiào)果。未来,百(bǎi)度的大数据(jù)不(bú)仅(jǐn)能够作为政府防控疫情的有(yǒu)益参考(kǎo),同时也可以为推动复工复产、提振经济发(fā)展提供有力的决策依据。
L型、勾型(xíng)、V型:百(bǎi)度大数(shù)据直观(guān)量(liàng)化(huà)疫情对(duì)经(jīng)济(jì)发展的冲击情况(kuàng) [1]
成(chéng)都(dōu)闹市区的奶茶已经(jīng)回归了往(wǎng)日的热闹,而(ér)天津旅(lǚ)游景区的小饭馆却迟迟难(nán)以复苏(sū);西北县城的超市恢复了元气,长江中部的工厂(chǎng)则尚未(wèi)将产(chǎn)量提(tí)升至疫情之(zhī)前的(de)平均水平……这些情况,百度大数据都“看”到(dào)了。
百度大数据的研(yán)究者在试图(tú)摸(mō)清地图数据(jù)与(yǔ)经济(jì)复苏情况的关联时,发现了两个关(guān)键因子——地图用(yòng)户(hù)到店数量(Volumes of Visits to Venues,简称(chēng)V3)与商户(hù)新开设的地理位(wèi)置(zhì)点数量(New Venues Created,简(jiǎn)称NVC)。V3可(kě)以反映(yìng)用户的活跃程度,NVC则反映商户的活跃程度(dù)。
于是,研究者将这两个数据的走势与GDP走势做成可视化(huà)图表(biǎo),结果发现,NVC、V3与GDP的走势,呈现强烈(liè)的(de)正(zhèng)相(xiàng)关,也(yě)就(jiù)是说,地(dì)图用户到店的情况与商(shāng)户新开设的地理位置点情况,可以(yǐ)反映(yìng)经济活(huó)动的强弱。
图1:从2018年(nián)第一季度到2020年第一季度,每个季(jì)度的国内GDP与百度地(dì)图用户到(dào)店数量,新开设(shè)的地理位置(zhì)点数量,呈现强烈正(zhèng)相关。(注(zhù):分析所用的数(shù)据皆为脱敏数(shù)据,所(suǒ)有处理环节均(jun1)不涉及个体隐私。下同。)
那(nà)么,这一发现,除(chú)了作为(wéi)经济活动的晴雨表,还有什么作用(yòng)呢?
百度研究人员又做(zuò)出了进一步的(de)分析。他们对各个(gè)行业、各个地(dì)区省(shěng)份的(de)经济活跃程度进行了(le)细致(zhì)分析,结果发现,不同行业(yè)、不(bú)同地区之间(jiān),经(jīng)济复苏情况呈现巨大差异,主(zhǔ)要(yào)分为以下三类——L型、勾型、V型。
先来看L型。这一曲线显(xiǎn)示复(fù)苏缓慢(màn),说明受疫情影响很大,目前(qián)仍然无法回(huí)到2018年(nián)同期的(de)水平;教育、交(jiāo)通运输(shū)、酒旅等行业(yè)遭受非常严重(chóng)的打击(jī)。下图(tú)分别是机场(chǎng)、火车站、教育培训机构、酒店的用户到店情况。可以看到,代表今年情况的红色V3曲线,呈现“L”形状(zhuàng),依(yī)旧在低谷(gǔ)摇摆。
图2:上图为(wéi)机场(chǎng)、火车站、教育培训机构(gòu)、酒店的(de)用户到(dào)店情况(V3)和新开设的地理位置点情况(NVC)
再来看勾型。虽遭受疫情影响,但是疫情缓和之(zhī)后,能(néng)够(gòu)恢复到2018年与2019年(nián)同期(qī)之间的经济水(shuǐ)平。餐饮酒吧、休闲娱乐、公园景(jǐng)点等是典型的(de)行业代表。这一复(fù)苏情况在V3的可视化图表里很(hěn)像一(yī)个反写(xiě)的(de)“对勾(gōu)”。
图(tú)3:勾型:疫情缓和之后(hòu),餐馆酒吧、娱乐(lè)设施、旅游景点等行业(yè)能够恢复到(dào)2018年与(yǔ)2019年同期(qī)之(zhī)间(jiān)的经济水平
最(zuì)后看V型(xíng)。尽管疫情的(de)影响严重(chóng),但是一旦疫情缓和之后,能够快速触底反(fǎn)弹,恢复到2019年同期(qī)水(shuǐ)平(píng),甚(shèn)至比(bǐ)那(nà)时情(qíng)况(kuàng)更好。代表行业有工作居住的地(dì)点、商超、医院药(yào)店等。
图4:V型:疫情缓和之后,工作居住地(dì)点、商超、医院药店等(děng)景气程度快速反弹(dàn),走势看上去像(xiàng)字母V
研究人员用(yòng)类似的思路(lù),将(jiāng)全国经济按照区域进行分析(xī),发现湖北、北京及天津的经济复苏情况为L型,复苏缓慢,与持续的疫情管控以(yǐ)及旅行限制有关;南部沿海、黄河中游、东部沿(yán)海、长江中游和北部沿(yán)海的数据显示出明(míng)显的(de)勾(gōu)型复(fù)苏趋(qū)势;大西北、东北(běi)和西南(nán)区(qū)域则展现出强劲的V型反弹(dàn)趋势。
百(bǎi)度大(dà)数据研究专家表示,五大经济区(qū)(南部沿海,黄河中游,东部沿海、长江中游、北(běi)部(bù)沿海)高(gāo)度依赖全球供应(yīng)链的经济(jì),在国内疫情结束之后,依然受(shòu)到国际整体疫情和(hé)经济(jì)形势的影响,未能快速反弹,呈现中间态的勾(gōu)型;而西北、东北、西南等地(dì)区经济对外依赖性相对较(jiào)小,疫情感染(rǎn)人数没有其他五大经济区多,恢(huī)复快,经济经(jīng)历(lì)短暂阵(zhèn)痛之后,触底反弹。
搜索(suǒ)COVID-9越(yuè)多,疫情防(fáng)控工作越(yuè)好?百度大数据(jù)“揭秘”疫情防治、人口迁徙与搜索行为(wéi)间的显著(zhe)关联 [2]
百度大数据还发(fā)现了人口出行情(qíng)况、搜索情况与疫情防控之间(jiān)的紧密关联(lián)。
先来看第一项发现:从武汉移(yí)出到中国其他主要城市人口情况,与当地疫情传(chuán)染情况的关系存在显著的正(zhèng)相关。
百度大数据(jù)统计了截至3月31日中国内(nèi)地300个除湖北(běi)外(wài)主要城市的确诊(zhěn)感染人数(shù),将其与1月23日迁入该城市(shì)的人(rén)口数做出(chū)了对比。
图5:截至2020年3月31日中国内地各主要城市确诊人数(shù) (上图) /当地确诊率 (下图) vs 2020年1月1日至(zhì)23日从武汉迁入人数
上面左图(tú)展示了全国主要城(chéng)市每个城(chéng)市(shì)从武汉迁入人数(shù)(x-轴)与截(jié)止到3月31日当地累计确诊人数(y-轴(zhóu))的关联。二者存在显著正相关。说明,当地累计确诊人数与当(dāng)地迁入的武(wǔ)汉人数存(cún)在直接的关联。
考虑到城市(shì)大小(xiǎo)的关系,百度研究者也以当(dāng)地感(gǎn)染率(每百万人平均感确诊人数)与从武汉迁入人数做出(chū)了分分析统计(jì),如右图。结果(guǒ)依然是显著正相关。
由此可以得出结(jié)论——在武汉(hàn)封(fēng)城之前(qián),从武(wǔ)汉迁入(rù)人口更多的城(chéng)市,会(huì)有更高的感染(rǎn)人数;同理推断,武(wǔ)汉越早采取封城措(cuò)施(shī),则疫情波及(jí)范围越小。
再(zài)来看第二项研究结果。数据显示,疫情(qíng)越严(yán)重的(de)地方,人均搜索COVID-19相关关键词的次(cì)数也越多。
图(tú)6:2020年1月33月(yuè)31日中国大陆各主要城(chéng)市人均COVID-19搜索次数 v.s 该城市(shì)确诊人数 (上图) /确诊(zhěn)率(下图)
可以看(kàn)出,中国内地(dì)除湖北(běi)外主要(yào)城市确诊感染(rǎn)人数与该城市人均搜索COVID-19相(xiàng)关关键词的次(cì)数存(cún)在显著(zhe)正相关(guān)。由(yóu)此得(dé)出结论,可能是由于(yú)感染(rǎn)情况引发的恐慌心理,人们更愿意(yì)搜索(suǒ)相关信(xìn)息。
百度(dù)的研究还发现,全国除(chú)湖北外主要(yào)城市(shì)的出(chū)行恢复率与当地人通过(guò)百度搜(sōu)索COVID-19次数呈现显(xiǎn)著的(de)负相关。也就是(shì)说,人均通过百度(dù)搜索COVID-19关键字(zì)较多的城市,人(rén)们出行意愿更低、或是当地疫情管控措施更为严格(gé) (在排(pái)除了其(qí)他(tā)潜在因(yīn)素的偏相关性分析后,此关联(lián)依然显(xiǎn)著)。
图7:截(jié)至2020年3月31日中(zhōng)国大陆各主要城市出行恢复率 v.s 该城市人均COVID-19相关信息搜索(suǒ)次数(shù):上图(tú)(Log-Log Plot), 下图正常尺度 。
可以看(kàn)出,当人(rén)们主动搜索信息得到了更多有(yǒu)关疫情的消息时,便更愿意待在家里(lǐ)。可以说(shuō),百度数据对人口隔离政策(cè)和移动限制政(zhèng)策提供(gòng)了重要参考。
大数据全面(miàn)赋能疫情防控:真(zhēn)实掌握(wò)+有效预警+精准施策
从上数研究(jiū)结果可以看出,百(bǎi)度地图、搜(sōu)索和健康(kāng)的多(duō)维度数据能够直观呈现疫情发展(zhǎn)及其社会影响。沈浩(hào)认为,百度大数据对于征服开展(zhǎn)疫情(qíng)防控(kòng)与社会治理(lǐ)而言,有着突出意义。
其一,有利于全面、真实(shí)、动态(tài)掌(zhǎng)握疫情防控(kòng)情况。平(píng)时访问发热门诊数量的人(rén)是否显著(zhe)增多?疫(yì)情期间居家隔离(lí)情况执行如何?百度都能够第一时间给予(yǔ)直(zhí)观、真实的数据化呈现。
其二,对可能发生的疫情相关风(fēng)险提出预警。百度(dù)地(dì)图数据可以直接为疫情期间(jiān)居家隔离(lí)政策、出行限制政策执行情况提供参考,对危险信号(hào)提出预(yù)警。
第三,动(dòng)态(tài)掌复(fù)工(gōng)复产、经济(jì)发展(zhǎn)的真实情况,形成真实全面的“景气指数”。各地、各行业复(fù)工复产情况究竟(jìng)如何(hé)?百度地图的商户和用户活跃程度(dù),便可以给予客观的(de)回应,作为(wéi)政府机(jī)构精准施(shī)策的基础。
利(lì)用大数据提(tí)升社会治理(lǐ)能力也是(shì)中国政府近年来不断努力的方(fāng)向(xiàng)。
2月18日,工业和信息(xī)化部印发了《关于运用新一(yī)代信息技术(shù)支撑服务疫情防(fáng)控和复(fù)工复产(chǎn)工作的(de)通知》,提出(chū)有效应用信息化手(shǒu)段助(zhù)力疫(yì)情防控和复工复产。在中央精神的指导下,社会各界纷纷探索以信息(xī)化途径高(gāo)效开展疫情防控。
实际上,在新冠肺(fèi)炎疫情发生(shēng)之(zhī)前,大数据在国内外公共卫生事件中的应用效果(guǒ)已经得到(dào)了较好的检验。此(cǐ)次疫情(qíng)发生后,韩国、日本、新加坡等国家(jiā)均采用了大数据手段防控疫情(qíng)、指导经济活动,取得了良好的效果。
在中国,相较17年前的SARS疫(yì)情,大数据在此次新冠疫情(qíng)防控中的(de)作用(yòng)尤为明显,涵盖个人(rén)健康状况(kuàng)认证、远程医(yī)疗问诊、应急物(wù)资(zī)调配(pèi)等方方(fāng)面面。
“互联网公司(sī)掌(zhǎng)握社会(huì)许多层面的(de)数(shù)据,政府一方面要对(duì)数据的合规性(xìng)加强监管,另一方面,也要(yào)积极(jí)利用互联网公司的大(dà)数据,可(kě)以联合科研院所和企(qǐ)业大(dà)数(shù)据机构协同进行(háng)大(dà)数(shù)据研(yán)究(jiū),助力疫情防控、应急管理和社会的精(jīng)细化治理,为决策提供有益(yì)参考。”沈浩(hào)表示。