積雲が映像制作したMV『RANGEFINDER』公開中
専門積雲

数理モデルを用いて推定感染者・発症者数を推定してみる:正規分布型と発症日分布型

専門
データの出典は奥村教授のgithubより、表示されているデータは4/27時点になっています。
新型コロナウイルスの感染拡大に伴い、4月7日に全国に緊急事態宣言が出されてから早くも半月が経とうとしています。報道では毎日のように新規感染者数が報告され、ともすればその大小のみで一喜一憂しがちになってしまいます。
しかし、連日報道で耳にする新規感染者数、および累計感染者数という一面的、短期的なデータだけでは、感染拡大が終息しつつあるのか、それともまだ拡大し続けているのかを判断することは極めて難しいといえるのではないでしょうか。
そこで今回は、既存のデータをもとに、日本が感染のどのフェーズにあるといえるのか、「正規分布型」と「発症日分布型」の二つの簡易な数理モデルの立て方、実際のデータと比較して評価をしながら、考察していきたいと思います。
スポンサーリンク

なぜ数理モデルが必要になるのか

ここで記述する内容は別途動画にて簡潔にまとまっているので、先にこちらのビデオをご覧になることをお勧めします(英語)。ただしモデル作成に当たって必要な情報は説明するのでご安心ください。

その日の検査陽性者数と実際の発症者数は異なると推定される

報道では、その日の検査陽性者数、及び累計陽性者数が報じられていますが、先に述べた通り、それだけで感染がどの段階にあるのかを見極めることは難しいといえます。

それにはいくつかの理由が挙げられます。

曜日ごとに検査数が異なる→陽性数も曜日によって異なる

PCR検査を行う保健所が土日休みになる関係上、日曜日と月曜日には陽性が確定する人が少なくなってしまいます。
出典:奥村晴彦,COVID-19 番外編2,曜日別の検査陽性確定者数
そのため、日曜日や月曜日に感染者が減っていると思い込んだり、逆に金曜日や土曜日の報道を見て感染が拡大している印象を受けたりしてしまいます。

検査陽性者の推移と発症者の推移(エピカーブ)はズレている

新型コロナウイルスの特徴の一つに、その潜伏期間の長さが挙げられます。したがって感染してから発症、そして検査を行うまでに人によっては数日から2週間まで幅があります。
さらに現在日本ではPCR検査の条件として、37.5度以上の発熱が3日以上続くことなどを挙げています。
これらの要素を加味すれば、その日の感染者だけでその日の感染拡大状況を考察することはほぼ不可能だといえます。
なお、日本では陽性確定者がいつ発症したかを(判明する限りで)集計しており、それをもとに発症者の推移(以後エピカーブと称す)を作成することができます。
出典:奥村晴彦,COVID-19 番外編2
このエピカーブを用いることで、数週間前の感染拡大状況を考察することが可能になります。しかし、残念ながらエピカーブも、これから紹介する数理モデルも、今現在の感染拡大状況を考察することはできません。
なぜなら、エピカーブは現在のデータから過去の発症者数を算出しただけにすぎず、今の発症者を算出することはできないからです。

エピカーブの利点

エピカーブによって数週間前の感染拡大状況を考察できると述べましたが、なぜでしょう。また、考察するうえで検査陽性者数の推移と比べて優れている点はどこでしょう。

曜日による差をある程度打ち消すことができる

先ほども述べたように、検査陽性者数の推移は曜日によって大きく異なってしまいます。それに比べエピカーブでは確定日は同じでも発症日が異なる人が多く存在するため、曜日による差が少なくなります(完全に打ち消されるわけではない

 

出典:奥村晴彦,COVID-19 番外編2,曜日別の発症者数

ロックダウンなどの行動変容の効果が反映されやすい

これが一番大きなメリットといえるでしょう。エピカーブは発症、検査、陽性確定という時間の遅延が取り除かれています。そのため、ロックダウンなどが行われた場合には、その効果が検査陽性数よりも早く反映されるという特徴があります。

 

出典:Tomas Pueyo,Coronavirus:Why You Must Act Now,武漢のエピカーブと検査陽性数の推移
上のグラフの青棒はエピカーブを、黄棒は検査陽性数の推移を表しています。武漢では1月23日にロックダウンが行われましたが、検査陽性数だけを見れば感染は止められず、効果がなかったように見えるかもしれません。
しかし、エピカーブを見れば、ロックダウン直後に新規発症者数の増加は収まり、その後すぐ減少に転じていることから、ロックダウンは機能したといえるのです。
このように、エピカーブは感染症対策の効果を検証するのに有効なグラフだといえるでしょう。

日本のエピカーブの欠点

しかしエピカーブ自体にも問題があります。

検査陽性者の全数をカバーしていない(日本の場合)

まず発症日を確定することができない場合、その陽性者はエピカーブのデータに加算されません。

また、一部地域では発症者のデータを提供していないところもあります。
出典:奥村晴彦,COVID-19 番外編2,東京のエピカーブ
上のグラフは東京のエピカーブですが、三月末以降のデータがないことがわかります。これらの減少分を考えると、エピカーブは実際に想定されるエピカーブよりも少ない数値で推移すると考えられます。
つまり、日本で提供されているエピカーブだけでは、感染拡大の実態を考察することは難しいと考えられます。
そして、エピカーブが不正確である以上、武漢のデータのように緊急事態宣言や自粛の効果を検証することが難しくなってしまうのです。

数理モデルを立てる意義

ここで数理モデルを立てます。この数理モデルは、実際に想定されるエピカーブを推定することを目指します。先ほど述べた不正確なエピカーブを、検査陽性者数から発症者数を推定するモデルを立て、補正します。

数理モデルから算出された推定エピカーブを用いれば、実際の発症者数がどれくらいいるのかざっくり知ることができ、また、先ほど述べたエピカーブの性質から、政策や行動変容の効果を検証することが可能になります。

そして数理モデルによって算出された推定エピカーブを実際のエピカーブと比較することで数理モデルそのものを評価すること、そして評価の結果最も妥当なモデルから導かれた推定エピカーブから、日本における緊急事態宣言や自粛の効果を検証しようというのが、今回の目的となります。

スポンサーリンク

数理モデルの立て方:正規分布型と発症日分布型

では、どのようにして実際のエピカーブを推定するのでしょうか。

ここでは、正規分布型とエピカーブ型という2つの数理モデルを説明し、それぞれがどのようなデータになるかを説明します。以下、使用するデータはWHOのデータに基づく実際の日本の新規検査陽性者の推移を用います。

正規分布型:実際の感染者数を推定するモデル

この数理モデルでは、「実際の感染者数」を推定することを目指します。エピカーブは発症者のグラフなので、性質が異なりますが、その良し悪しについては後程議論します。

まず最初に、日本全体の新規検査陽性者の推移のデータを用意します。

出典:奥村晴彦,COVID-19,COVID-JP.csvより作成
そしてその中の、特定の日について考えてみます。ここでは4/11を例にとって考えます。
4/11に陽性という結果が出た人(658人いる)が感染したのはいつでしょうか。
CDCによれば、ウイルスに感染して発症するまでの潜伏期間が2日~14日と推定されています。また発症して、検査し、検査の結果が返ってくるまでを2日とすると、検査で陽性と判明した人が実際に感染したのは、陽性と判明する4~16日前と推測されます。
これをもとに、正規分布を作成します。中央値10,標準偏差3の確率密度関数として出力すると、以下のヒストグラムを得ます。4日未満と16日以上を省いているのは、今回はP値を5%に設定し信頼区間を95%に設定していますが、これらの日付になる確率は5%以下になるからです。
このヒストグラムに4/11の陽性者数である658を掛けて、横軸を日付に直すとこうなります。
そしてこれを新規検査陽性者の推移に重ねてみます。
するとご覧のように、4/11に陽性と判定された人が実際に感染しているのは3月末から4月初めに集中していると推測できます。
他の日付についても同様に行い、同じ日付のデータを合算するとこのような推定感染者数のグラフを得ます。
 
こうして実際の感染者数を推定するグラフを得ることができました。ここで注意してほしいのが4/9以降の推定ができないということです。先に述べたように、感染してからの潜伏期間の長さや、検査結果表示までの遅延があるため、これ以降のデータはさらに日数が経過しなければ得られないのです。

発症日分布型:実際の発症者(エピカーブ)を推定するグラフ

この数理モデルでは「実際の発症者数」を推定することを目指します。おおむね手法は同じなのですが、先ほどは感染者の推定を正規分布で行ったのに対し、発症日分布型では発症者の推定を実際に得られた(検査陽性確定日-発症日)のデータのヒストグラムを用いて行います。

出典:奥村晴彦,COVID-19,COVID-19.csvより作成

これを確率密度関数に変換します。

あとは正規分布型と同様の作業を行い、実際の発症者の推定グラフ、つまり推定エピカーブを得ます。

こうして推定エピカーブを得ることができました。このグラフも正規分布モデルと同様の理由で、4/9以降のデータを得ることはできません。

数理モデルの評価:エピカーブとのフィッティング

さて、どちらの数理モデルがより有効といえるでしょうか。すでに得られている実際のエピカーブと比較して評価していきたいと思います。

正規分布型(推定感染者数)

先ほどは青棒で示した推定値を、比較しやすいように折れ線グラフで表しています。感染初期の3月中旬ごろまではよくフィッティングしているように見えますが、それ以降は大きくずれています

原因として真っ先に考えられる要因は、ウイルスの潜伏期間です。エピカーブは発症日のグラフなので、感染者のグラフよりも感染拡大の状況が遅れて反映されると考えられます。

また、先ほど述べたエピカーブ自体の問題点(全数を把握していない)なども、フィッテングが上手くいっていない要因と考えられます。

発症日分布型(推定発症者数・推定エピカーブ)

続いて発症日分布型です。実際の発症日分布をもとにしていることもあり、エピカーブとのフィッテイングは正規分布型と比べてはるかに良好です。4月以降のフィッティングがずれているのは、先ほど述べたエピカーブ自体の問題が要因として考えられます。

しかし発症日分布が正規分布よりもなめらかではないため、このモデルで出力される結果も正規分布モデルより滑らかではないという問題点があります。

 

いずれの数理モデルも、エピカーブ自身の問題により、どれほど正確に推定できているかを測ることは現状難しいと言えます

両モデルの利点・欠点

正規分布型

・感染者の推移を推測しているため、感染拡大の状況変化を機敏に反映する。
発症日分布が十分に得られていない国・地域に適応できる
ウイルスが発症前から感染力を持つ場合、実際の感染者数推定が重要になるため、有用性が増す。
・エピカーブが得られている地域ではそこから推定エピカーブを算出したほうが正確性が高い。
・検査時間や検査条件などで発症日分布が大きい場合に正確性を欠く。

発症日分布型

・実際の発症日分布という疫学的データに基づいており、正確性が比較的高い。
・エピカーブが十分に得られている国では、実際に得られたエピカーブにフィットしやすい。
・ウイルスが発症してから感染力を持つ場合、実際の発症者数推定が重要になるため、有用性が増す。
・発症者の推移を推測しているため、実際の感染拡大状況は遅れて反映される
発症日分布が十分に得られていない国・地域では機能しない。

緊急事態宣言の効果検証:推定感染者・発症者の増加率の推移から考察する

さてここからは、正規分布型と発症日分布型の両方を用いて、4/7に出された緊急事態宣言がどれほど効果を上げているのかについて、少ないデータから考察していきたいと思います。

まずは正規分布型から得られた新規感染者数の増加率(推定)です。黒棒は緊急事態宣言が出された4/7をプロットしています。

ここで重要な点は、増加率が1を下回っているか否かです。1を上回り続ける場合、感染者は指数的増加をし続けていることになり、感染拡大は止まらなくなります。逆に1を下回り続ける場合、感染者は指数的に減少し、やがて収束に向かうことになります。

感染者のトレンドは推定によれば4月頭には増加率1を下回ったように見えます。緊急事態宣言後の2日にはその増加率の減少はその前の数日に比べれば大きくなっており、まだ結論付けるまでの日数は足りていませんが、機能している可能性が見えます

 

続いて発症日分布型から得られた新規発症者数の増加率(推定)です。黒棒は同様に4/7をプロットしています。

こちらについてはグラフの特性上、緊急事態宣言の効力について述べるのは時期尚早といえるでしょう。しかしながら、増加率を見れば緊急事態宣言後に1を下回っており、この傾向が緊急事態宣言の効果で促進される場合、終息への道筋が見えてくるかもしれません。

まとめ

今回は二つの数理モデルを用いて感染者数と発症者数が実際どのように推移しているのかを推測してみました。

まだ緊急事態宣言とそれに伴う行動変容が機能したかを評価するには時期尚早ですが、これらのモデルを製作することで、皆様が日々の報道に一喜一憂せず、根拠を持って冷静に事態を静観する一助になれば、と思います。

最後に数理モデルの実装データ(Excel)を置いておきます。参考までにご覧ください。

 

コメント

タイトルとURLをコピーしました