감염병의 대유행 가능성

Author

Jong-Hoon Kim

Published

March 4, 2024

감염병 인류 라는 책을 재미있게 읽는 중이다. 136페이지에는 기초감염재생산지수와 대유행의 가능성에 대한 간단한 수식이 나온다. $대유행의 가능성 = 1 - \frac{1}{R_{0}}$

$R_{0}$ 는 기초감염재생산지수, 즉 한 사람의 감염자가 다른 모든 사람이 감수성자 (susceptible) 일때 감염시키는 평균 감염자수를 나타낸다. 위 수식은 제한적인 경우에만 적용된다. 감염병 유입 시 대유행의 가능성에 대해 좀 더 일반적으로 적용될 수 있는 방법에 대해 적어보려고 한다. 물론 아래 내용도 상당히 이상적인 상황에 대한 기술일 뿐이고 현실은 그 보다 훨씬 더 복잡할 것이다. 감염병 유입 시 대유행의 가능성에 대한 내용은 Niels G. Becker가 저술한 Modeling to Inform Infectious Disease Control의 제 2장에 자세하게 기술되어 있다.

동일한 사람들로 이루어진 인구 집단에서 감염병이 퍼져나가는 현상을 생각해 보자. 한 사람이 평균적으로 $R_{0}$ 명을 감염시킨다고 할 때 $R_{0}$ 은 평균일뿐 후속 감염자수는 어떤 확률 분포를 가진다고 생각해볼 수 있다. 한 명의 감염자가 총 $j$ 명의 후속 감염자를 만들어 내는 확률을 $P (X = j) = p_{j}$ 라고 할 때 $R_{0}$ 는 아래와 같이 표현할 수 있다.

$R_{0} = \sum_{k = 0}^{\infty} j p_{j} .$

대유행의 가능성은 역으로 생각하는 것이 유리하다. 즉 대유행이 아닌 소규모의 감염으로 막을 내리는 확률, $θ$ , 을 구한 후 대유행의 확률은 $1 - θ$ 로 구하는 것이다. 소규모의 감염이 일어나기 위해서는 유입된 초기 환자 (index patient)가 아무도 감염시키지 않거나 혹은 몇 명을 감염시켰다고 할지라도 후속 감염자들이 추가적으로 일으키는 감염이 소규모일때만 가능할 것이다. 즉 소규모 감염의 확률, $θ$ , 는 아래의 식을 만족한다.

$\begin{matrix} (1) & θ = p_{0} + p_{1} θ + p_{2} θ^{2} + . . . \end{matrix}$

위 식을 보면 $θ$ 는 후속 감염자수가 어떠한 분포를 따르느냐에 따라 달라질 것이라 예상할 수 있다. 가장 흔히 쓰이는 분포 중의 하나인 푸아송 분포 (Poisson distribution)를 생각해보자. 화률 분포 함수는 아래와 같다.

$Prob (X = j) = \frac{R^{j} e^{R}}{j!} for j = 0, 1, 2, . . .$

이 경우 Equation 1 의 우변은 아래와 같이 나타내어질 수 있다.

$\sum_{j = 0}^{\infty} p_{j} θ^{j} = e^{(1 - θ) R_{0}} .$

따라서 $θ$ 는 아래의 식을 계산하면 된다. 다만 해를 직접 구할 수는 없고 수치해석방법을 이용 해서 답을 구해야 한다.

$θ = e^{(1 - θ) R_{0}} .$

위에서 언급한 $대유행의 가능성 = 1 - \frac{1}{R_{0}}$ 는 후속 감염자수의 분포가 기하분포 (geometric distribution)를 따를때 성립한다. 기하분포는 아래와 같이 표현되 $Prob (X = j) = (1 - p)^{j} p$

평균과 성공확률의 관게, $R = \frac{1 - p}{p}$ , 이용하여 다시 표현하면 아래와 같다.

$Prob (X = j) = (\frac{R_{0}}{1 + R_{0}})^{j} \frac{1}{1 + R_{0}}$ 위에서와 동일하게 계산하면 아래와 같다. $\sum_{j = 0}^{\infty} p_{j} θ^{j} = \frac{1}{1 + (1 - θ) R_{0}}$ 따라서 아래의 식을 풀면 $θ$ 를 구할 수 있다.

$θ = \frac{1}{1 + (1 - θ) R_{0}} .$

$θ = \frac{1}{R_{0}} .$

따라서 감염병 인류 책에서 언급된 것처럼 $대유행의 가능성 = 1 - \frac{1}{R_{0}} .$ 마지막으로 후속 감염자수가 이항분포 (negative binomial distribution)을 따른다고 가정해보자. 최근 연구들에서 빈번하게 언급되고 가장 현실에 가까운 가정인 듯 하다.

다양한 모수를 사용하여 표현할 수 있고 평균 $R_{0}$ 과 확산(dispersion; $k$ )를 이용하여 나타내면 아래와 같다. 이항 분포는 $k = 1$ 일 때는 기하분포와 동일하고 $k = \infty$ 일때는 푸아송분포와 동일하다. 코로나 19의 경우 $k$ 값이 약 0.55이다.

$Prob (X = j) = \frac{Γ (k + j)}{j! Γ (k)} {(\frac{k}{k + R_{0}})}^{k} {(\frac{R_{0}}{k + R_{0}})}^{j} for k = 0, 1, 2, . . .$ The probability of a minor outbreak, 위와 동일한 방법으로 계산하면 우변은 아래와 같다.

$\sum_{j = 0}^{\infty} p_{j} θ^{j} = {(\frac{k}{k + (1 - θ) R_{0}})}^{k}$ 따라서 $θ = {(\frac{k}{k + (1 - θ) R_{0}})}^{k}$ 를 계산하여 소규모감염의 확률을 계산하고 $1 - θ$ 를 계산하여 대규모유행 확률을 계산하면 된다.

R 시물레이션을 통해서 세방법이 어떻게 다른 결과를 나타내는지 살펴보자

prob_outbreak_pois = function(theta, R0){
  theta - exp(-R0 + R0*theta) 
}
prob_outbreak_geo = function(R0){
  1/R0 
}
prob_outbreak_nb = function(theta, R0, k){
  theta - (k / (k + R0 - R0*theta))^k 
}

Rs <- seq(1.1, 10, length.out=100)
theta1 <- sapply(Rs, function(x) 
  min(rootSolve::multiroot(prob_outbreak_pois, c(0, 1), R0=x)$root))
theta2 <- sapply(Rs, function(x) prob_outbreak_geo(x))
theta3 <- sapply(Rs, function(x) 
   min(rootSolve::multiroot(prob_outbreak_nb, c(0, 1), R0=x, k=0.55)$root))
df <- data.frame(R0=rep(Rs,3), 
                 dist=rep(c("Pois","Geom","NB(k=0.55)"),each=100),
                 prob_outbreak=c(1-theta1,1-theta2,1-theta3))

library(ggplot2)
extrafont::loadfonts("win", quiet=TRUE)
theme_set(hrbrthemes::theme_ipsum_rc(base_size=14, subtitle_size=16, 
                                     axis_title_size=12))

ggplot(df) +
  geom_line(aes(R0, prob_outbreak, color=dist))+
  ggtitle(expression("Probability of a large outbreak vs." ~italic(R)[0])) +
  labs(y="Probability of a large outbreak", x=expression(italic(R)[0]), color="")

# ggsave("outbreak_prob.png", units="in", width=3.4*2, height=2.7*2)

각 분포에 대한 무한 수열의 합과 $θ$ 에 대한 해는 아래 Mathematica 명령어를 사용하여 확인할 수 있다.

Sum[PDF[PoissonDistribution[R],j]\[Theta]^j, {j, 0, Infinity}]
FindRoot[\[Theta] - E^(R (-1 + \[Theta])) == 0, {\[Theta], 0.1}] /. 
 R -> 3
Sum[PDF[GeometricDistribution[1/(1+R)],j]\[Theta]^j, {j, 0, Infinity}]
FindRoot[\[Theta] - 1/(R + \[Theta] - R \[Theta]) == 0, {\[Theta], 
   0.5}] /. R -> 3

FullSimplify[Sum[PDF[NegativeBinomialDistribution[k,k/(R+k)],i]\[Theta]^i, {i, 0, Infinity}],{ k>0, R>1, 0<\[Theta]<1}ㅑ
FindRoot[\[Theta] - (k/(k + R - R \[Theta]))^k == 0, {\[Theta], 0.1}]