原標(biāo)題:科學(xué)模型如何幫助我們了解傳染病的傳播規(guī)律?
傳染病的傳播過程是怎樣的呢?不同傳染病的傳播過程是一樣的嗎?什么情況下,傳染病的擴(kuò)散會(huì)停止?每個(gè)人的傳染程度相等嗎?斯科特·佩奇的《模型思維》為我們了解傳染病的傳播規(guī)律提供了不少參考工具。
隨著新型冠狀病毒肺炎病例的不斷上升,不少科學(xué)家對(duì)此次疫情的發(fā)展前景作出自己的預(yù)測。例如,1月21日,德國哥廷根大學(xué)教授于曉華就在社交平臺(tái)上稱,自己做了一個(gè)簡單SIR模型,用SARS參數(shù)模擬武漢肺炎傳播途徑。他得出的結(jié)論認(rèn)為:
從病毒暴發(fā)后的大概90天到達(dá)高峰。第一例發(fā)現(xiàn)在12月8日,50天左右開始集中暴發(fā)(1月20日左右,比較吻合),90天左右達(dá)到高峰(預(yù)計(jì)在3月上旬),4個(gè)月左右接近尾聲(四月上旬),5月上旬疫情結(jié)束。從目前來看,這個(gè)模型預(yù)測還是吻合疫情發(fā)展情況的。
科學(xué)家是如何用模型來推算病毒的傳播?傳染病的傳播過程是怎樣的呢?不同傳染病的傳播過程是一樣的嗎?什么情況下,傳染病的擴(kuò)散會(huì)停止?每個(gè)人的傳染程度相等嗎?
在《模型思維》這本書中,圣密歇根大學(xué)復(fù)雜性研究中心“掌門人”斯科特·佩奇為我們理解傳染病的傳播規(guī)律提供了3種簡單的模型工具。下文經(jīng)授權(quán)節(jié)選自《模型思維》部分章節(jié)的內(nèi)容。
《模型思維》,斯科特·佩奇著,賈擁民譯,湛廬文化|浙江人民出版社2019年11月版
撰文丨斯科特·佩奇
廣播模型
本章中介紹的所有模型都要假設(shè)存在一個(gè)相關(guān)人群,用NPOP表示。相關(guān)人群包括那些可能患上傳染病、了解信息或采取行動(dòng)的人。相關(guān)人群所指的并不是一個(gè)城市或國家的全部人口。如果我們要為連續(xù)主動(dòng)脈縫合法的擴(kuò)散建模,那相關(guān)人群就是指心臟外科醫(yī)生,而不是居住在費(fèi)城的所有人。
在任何時(shí)候,總會(huì)有些人患上了某種傳染病、了解特定信息或采取了一定行動(dòng)。我們將這些人稱為感染者或知情者(用I t表示),相關(guān)人群中除了感染者或知情者之外的其余成員則是易感者(用St表示)。這些易感者可能會(huì)感染傳染病、了解信息或采取行動(dòng)。相關(guān)人群的總?cè)藬?shù)等于感染者或知情者人數(shù)加上易感者人數(shù)的總和:NPOP=I t+St。
廣播模型刻畫了思想、謠言、信息或技術(shù)通過電視、廣播、互聯(lián)網(wǎng)等媒體進(jìn)行的傳播。大多數(shù)時(shí)事新聞都是通過廣播形式傳播的。這個(gè)模型的目標(biāo)是描述一個(gè)信息源傳播信息的過程,可以是政府、企業(yè)或報(bào)紙。它也適用于通過供水系統(tǒng)傳播污染的情況。但是,這個(gè)模型不適用于在人與人之間傳播的傳染病或思想。由于廣播模型更適合描述思想和信息的傳播(而不是傳染病的傳播),所以我們?cè)谶@里說知情者的人數(shù),而不說感染者的人數(shù)。
在給定時(shí)間段內(nèi),知情者人數(shù)等于前一期的知情者人數(shù)加上易感者聽到信息的概率乘以易感者人數(shù)。按照慣例,初始人口全部由易感者組成。要計(jì)算未來某期的知情者人數(shù),只需要將知情者人數(shù)和易感者人數(shù)代入上述方程即可。由此得到的將是一個(gè)r形采用曲線。
想象一下:某個(gè)擁有100萬居民的城市的市長宣布了一項(xiàng)新的稅收政策。在他宣布之前,沒有人知道這項(xiàng)政策。假設(shè)某人在任何一天聽到這個(gè)新聞的概率等于30%(即,Pbroad=0.3),那么第一天會(huì)有30萬人聽到這個(gè)新聞。在第二天,剩下的70萬人中有30%的人,即21萬人會(huì)聽到這個(gè)新聞。在每一個(gè)時(shí)期,知情者的人數(shù)都會(huì)增加,并且以一個(gè)遞減的速度增加,如圖11-1所示。
在廣播模型中,相關(guān)人群中的每一個(gè)人最終都會(huì)知悉信息。如果有適當(dāng)?shù)臄?shù)據(jù),就可以估計(jì)出相關(guān)人群的規(guī)模。假設(shè)一家企業(yè)為練習(xí)太極拳的人推出了新設(shè)計(jì)的運(yùn)動(dòng)鞋,并在第一個(gè)星期就收到了20 000雙鞋的訂單。如果在第二個(gè)星期收到了16 000雙鞋的訂單,那么我們可以大致估計(jì)出他們最終的總銷售量,也就是相關(guān)人群的規(guī)模為100 000。
當(dāng)然,對(duì)于根據(jù)僅有的兩個(gè)數(shù)據(jù)點(diǎn)估計(jì)出來的任何結(jié)果,我們都不應(yīng)該抱以太大的信心。這個(gè)模型無疑遺漏了許多現(xiàn)實(shí)世界的特征。人們既可能通過傳媒獲悉相關(guān)消息,也可能通過口耳相傳聽到消息,而且有些人可能會(huì)購買不止一雙鞋子,或者可能存在針對(duì)潛在消費(fèi)者的廣告,等等。如果把這些因素都包括進(jìn)去,估計(jì)出來的結(jié)果肯定會(huì)有所不同。盡管必須牢記這個(gè)注意事項(xiàng),但是這個(gè)模型確實(shí)提供了一個(gè)粗略的估計(jì)。這個(gè)企業(yè)不應(yīng)該期望能夠賣出200萬雙鞋,但是應(yīng)該有信心可以賣出不止100 000雙鞋。隨著更多數(shù)據(jù)的出現(xiàn),估計(jì)結(jié)果是可以得到改進(jìn)的。如果第三個(gè)星期的銷售額是13 000雙(這等于模型預(yù)測的數(shù)量),那么這個(gè)企業(yè)對(duì)當(dāng)初的預(yù)測可以寄予更大的信心。
擴(kuò)散模型
大多數(shù)傳染病,以及關(guān)于產(chǎn)品、思想和技術(shù)突破的信息,都是通過口口相傳而傳播開來的,擴(kuò)散模型刻畫了這些過程。擴(kuò)散模型假設(shè),當(dāng)一個(gè)人采用了某種技術(shù)或患上了某種傳染病時(shí),這個(gè)人有可能將之傳遞或傳染給與他接觸的人。在傳染傳染病的情況下,個(gè)人的選擇不會(huì)在其中發(fā)揮任何作用。一個(gè)人患上某種傳染病的概率取決于諸如遺傳、病毒(細(xì)菌),甚至環(huán)境溫度等因素。在炎熱潮濕的季節(jié),瘧疾的傳播速度要比在寒冷干燥的季節(jié)快得多。
技術(shù)的傳播則與采用者的選擇有關(guān),因此更有用的技術(shù)被采用的概率更高。但是在這里,我們并沒有在模型中明確將這種情況選擇考慮在內(nèi)。這樣一來,蘋果智能手表的新潮性就發(fā)揮了與流感病毒同樣的作用。
在這里,我們更看重的是信息的傳播,因此我們將人們分為知情者或不知情的新人。如果新人與知情者相遇且信息在他們之間傳播,那么新人就會(huì)變成知情者。這種事件的發(fā)生,因環(huán)境而異。生活在城市中的人,相遇的概率可能比生活在農(nóng)村的人更高,同時(shí)也有更高的接觸概率。非常吸引人眼球的新聞也比一般的新聞被分享的概率更高,例如,關(guān)于外星人降臨登陸的新聞被分享的概率比關(guān)于M&M公司的椒鹽卷餅重新上市的新聞更容易被分享。因此,我們可以將擴(kuò)散概率(diffusion probability)定義為接觸概率(contact probability)和分享概率(sharing probability)的乘積。我們可以根據(jù)擴(kuò)散概率來構(gòu)建模型,但是在估計(jì)或應(yīng)用模型時(shí),必須獨(dú)立地跟蹤接觸概率和分享概率。
擴(kuò)散模型假定隨機(jī)混合(random mixing)。隨機(jī)混合的含義是,相關(guān)群體中任何兩個(gè)人接觸的可能性都相同。對(duì)于這個(gè)假設(shè),我們應(yīng)該保持警惕。就描述幼兒園內(nèi)傳染病傳播的擴(kuò)散模型而言,這可能是一個(gè)準(zhǔn)確的假設(shè),因?yàn)橛變簣@里兒童之間的相互接觸是高頻率的。但是,如果將它應(yīng)用于城市人口則是有問題的。在城市中,人們并不是隨機(jī)混合的。人們?cè)谝欢ǖ纳鐓^(qū)中生活,在一定的場所內(nèi)工作,他們屬于工作團(tuán)隊(duì)、家庭和社會(huì)團(tuán)體,他們的互動(dòng)主要發(fā)生在這些群體中。但是同時(shí)也不要忘記,一個(gè)假設(shè)要成為有用模型的一部分,其實(shí)不一定非得十分準(zhǔn)確不可。因此,我們將繼續(xù)使用這個(gè)假設(shè),同時(shí)保持開放的心態(tài),在需要改變的時(shí)候隨時(shí)改變這個(gè)假設(shè)。
在這個(gè)模型中,與在傳播模型中一樣,從長期來看,相關(guān)人群中的每個(gè)人都會(huì)掌握信息。不同的是,擴(kuò)散模型的采用曲線是S形的。最初,幾乎沒有人知情,I 0很小。因此,能夠與知情者接觸的易感者人數(shù)也必定很小。隨著知情者人數(shù)的增加,知情者與不知情者之間接觸的機(jī)會(huì)增加,這又使知情者的人數(shù)更快地增多。當(dāng)相關(guān)人群中幾乎每個(gè)人都成了知情者時(shí),新知情的人數(shù)會(huì)減少,從而形成了S形的頂部。技術(shù)的采用曲線通常也具有這種形狀。例如,雜交種子的采用曲線雖然因州而異(艾奧瓦州采用雜交種子的速度比亞拉巴馬州更快),但是所有州的采用曲線都是S形的。
在廣播模型中,根據(jù)數(shù)據(jù)估算相關(guān)人群規(guī)模是一件相當(dāng)簡單的事情。采用者的初始數(shù)量與相關(guān)人群規(guī)模密切相關(guān)。與此相反,利用擴(kuò)散模型的數(shù)據(jù)估計(jì)相關(guān)群體的規(guī)??赡軙?huì)非常困難。產(chǎn)品銷售量的增加,可能是由于一個(gè)很小的相關(guān)人群內(nèi)部的高擴(kuò)散概率,也可能是由于一個(gè)很大的相關(guān)人群中的低擴(kuò)散概率。
圖11-2顯示了兩個(gè)假想的智能手機(jī)應(yīng)用程序的相關(guān)數(shù)據(jù)。在第一天,每個(gè)應(yīng)用程序都有100人購買。在接下來的5天中,應(yīng)用程序1擁有更高的總銷量和更快的銷量增長。如果沒有模型,我們很可能會(huì)預(yù)測應(yīng)用程序1擁有更大的市場。但是,用模型擬合這兩組數(shù)據(jù)的結(jié)果表明,事實(shí)與我們猜想的恰恰相反。
應(yīng)用程序1擬合的擴(kuò)散概率為40%,相關(guān)人群規(guī)模為1 000人;而應(yīng)用程序2的擴(kuò)散概率為30%,相關(guān)人群規(guī)模為100萬人。4事實(shí)上,只要再過幾天,我們就會(huì)觀察到應(yīng)用程序2的相關(guān)人群更大。但是,如果沒有模型,如果不能根據(jù)前5天的數(shù)據(jù)來進(jìn)行分析,我們就可能會(huì)對(duì)總銷售額給出不正確的推斷。
在使用擴(kuò)散模型來指導(dǎo)行動(dòng)的時(shí)候,我們必須將擴(kuò)散概率分解為分享概率和接觸概率的乘積。為了提高應(yīng)用程序的銷售速度,開發(fā)人員既可以設(shè)法提高人們相互接觸的概率,也可以設(shè)法加大他們分享關(guān)于應(yīng)用程序信息的概率。要想改變第一個(gè)概率是很困難的。為了增大第二個(gè)概率,開發(fā)人員可以為帶來了新注冊(cè)用戶的老用戶提供一些激勵(lì),事實(shí)上,許多開發(fā)人員都是這樣做的,比如游戲開發(fā)者可能會(huì)給帶來了新注冊(cè)玩家的老玩家獎(jiǎng)勵(lì)游戲積分。雖然這樣做能夠增加擴(kuò)散速度,但是并不會(huì)影響總銷量,至少根據(jù)這個(gè)模型來看不會(huì)有影響。如上所述,總銷量等于相關(guān)人群的規(guī)模,而與分享概率高低無關(guān),提高銷售速度不會(huì)帶來長期的影響。
大多數(shù)消費(fèi)品和信息都是通過廣播和擴(kuò)散傳播的。而巴斯模型則將這兩個(gè)過程組合在一起了。5巴斯模型中的差分方程等于廣播模型和擴(kuò)散模型中的差分方程之和。在巴斯模型中,擴(kuò)散概率越大,采用曲線的S形就越顯著。電視、收音機(jī)、汽車、電子計(jì)算機(jī)、電話機(jī)和手機(jī)的采用曲線形狀都是r形和S形的組合。
SIR 模型
到目前為止,在我們已經(jīng)討論過的模型中,一旦有人采用了一項(xiàng)技術(shù),則永遠(yuǎn)不會(huì)放棄它。對(duì)于電力、洗碗機(jī)和電視等技術(shù)來說,確實(shí)如此:一旦采用之后,一般永遠(yuǎn)不會(huì)不采用。但這并不適用于所有通過擴(kuò)散傳播的事物,例如我們患上了某種傳染病之后不久就會(huì)恢復(fù)健康,或者當(dāng)我們采用了某種流行款式或參加了某項(xiàng)潮流運(yùn)動(dòng)之后(例如,某種時(shí)裝或舞蹈),是以放棄的。遵循慣例,我們將放棄所采用的某種事物的人稱為痊愈者。由此產(chǎn)生的模型,即SIR模型(易感者、感染者、痊愈者),在流行病學(xué)中占據(jù)了中心位置。
由于這個(gè)模型起源于流行病研究領(lǐng)域,同時(shí)也因?yàn)榭紤]傳染病的痊愈更為自然,因此我們以傳染病的傳播為例來描述SIR模型。為了避免過于復(fù)雜的數(shù)學(xué)計(jì)算,我們假設(shè)治愈傳染病的人會(huì)重新進(jìn)入易感人群,也就是說治愈傳染病并不會(huì)產(chǎn)生未來對(duì)傳染病的免疫力。
流行病學(xué)家對(duì)接觸概率和傳播概率會(huì)進(jìn)行單獨(dú)跟蹤,我們也會(huì)這樣做。接觸概率取決于傳染病如何從一個(gè)人傳播到另一個(gè)人。艾滋病通過性接觸傳播;白喉通過唾液傳播;流感病毒通過空氣傳播。因此,流感的接觸概率高于白喉,白喉的接觸概率又高于艾滋病。而且,在發(fā)生接觸后,各種傳染病的傳播概率也會(huì)有所不同。白喉比SARS更容易傳染給另一個(gè)人。
SIR模型會(huì)產(chǎn)生一個(gè)臨界點(diǎn),就是所謂的基本再生數(shù)R0,也就是接觸概率乘以擴(kuò)散概率與痊愈概率之比。某種傳染病,如果R0大于1,那么這種傳染病就可以傳遍整個(gè)人群,而R0小于1的傳染病則趨于消失。在這個(gè)模型中,信息(或者,在這個(gè)例子中是傳染?。┎⒉灰欢〞?huì)傳播到整個(gè)相關(guān)人群。能不能做到這一點(diǎn)取決于R0的值。因此,像疾病控制中心這樣的政府機(jī)構(gòu)必須依據(jù)對(duì)R0的估計(jì)來指導(dǎo)政策制定。
如表11-1所示,麻疹可以通過空氣傳播,因而它的再生數(shù)高于艾滋病,艾滋病只能通過性接觸和共用針頭傳播。對(duì)R0的估計(jì)假設(shè)人們不會(huì)為了應(yīng)對(duì)傳染病而改變行為。
然而,當(dāng)學(xué)校里虱子肆虐時(shí),家長的反應(yīng)可能是讓孩子待在家中,以降低接觸概率,還可能會(huì)剃光孩子的頭發(fā),減少接觸發(fā)生時(shí)傳播的可能性。這兩種行為變化都會(huì)降低虱子傳播的R0。在沒有疫苗的情況下,檢疫是一個(gè)選擇,但是成本很高。如果存在疫苗,那么疫苗接種可以預(yù)防傳染病傳播。即便做不到每個(gè)人都接種疫苗,也可以預(yù)防傳染病傳播。必須接種疫苗的人的比例,即疫苗接種閾值(vaccination threshold),可以通過公式V?R010求出。我們可以從上述模型中推導(dǎo)出這個(gè)公式。
疫苗接種閾值隨R0的增加而提高。例如,脊髓灰質(zhì)炎的R0為6,因此為了防止脊髓灰質(zhì)炎的傳播,疫苗必須覆蓋5/6的人群。而麻疹的R0為15,為了阻止麻疹的傳播,疫苗必須覆蓋14/15的人口。疫苗接種閾值的數(shù)學(xué)推導(dǎo)也為決策者提供了指引,如果接種疫苗的人數(shù)太少,這種傳染病就會(huì)傳播開來,因此政府接種疫苗的次數(shù)會(huì)超過模型估計(jì)的閾值。對(duì)于麻疹和脊髓灰質(zhì)炎等R0非常高的傳染病,政府將努力保證所有人都接種疫苗。
有些人擔(dān)心疫苗有副作用,選擇不參加疫苗接種計(jì)劃。如果這些人只占人口的一小部分,那么其他人接種疫苗也可以防止這些人感染這種傳染病,流行病學(xué)家將這種現(xiàn)象稱為群體免疫力。選擇不接種疫苗的人事實(shí)上是搭了其他接種疫苗的人的便車。
作者丨斯科特·佩奇
摘編丨李永博
編輯丨徐悅東
校對(duì)丨翟永軍?