なぜ数理モデルが必要になるのか
ここで記述する内容は別途動画にて簡潔にまとまっているので、先にこちらのビデオをご覧になることをお勧めします(英語)。ただしモデル作成に当たって必要な情報は説明するのでご安心ください。
その日の検査陽性者数と実際の発症者数は異なると推定される
報道では、その日の検査陽性者数、及び累計陽性者数が報じられていますが、先に述べた通り、それだけで感染がどの段階にあるのかを見極めることは難しいといえます。
それにはいくつかの理由が挙げられます。
曜日ごとに検査数が異なる→陽性数も曜日によって異なる
検査陽性者の推移と発症者の推移(エピカーブ)はズレている
これらの要素を加味すれば、その日の感染者だけでその日の感染拡大状況を考察することはほぼ不可能だといえます。
エピカーブの利点
エピカーブによって数週間前の感染拡大状況を考察できると述べましたが、なぜでしょう。また、考察するうえで検査陽性者数の推移と比べて優れている点はどこでしょう。
曜日による差をある程度打ち消すことができる
先ほども述べたように、検査陽性者数の推移は曜日によって大きく異なってしまいます。それに比べエピカーブでは確定日は同じでも発症日が異なる人が多く存在するため、曜日による差が少なくなります(完全に打ち消されるわけではない)
ロックダウンなどの行動変容の効果が反映されやすい
これが一番大きなメリットといえるでしょう。エピカーブは発症、検査、陽性確定という時間の遅延が取り除かれています。そのため、ロックダウンなどが行われた場合には、その効果が検査陽性数よりも早く反映されるという特徴があります。
日本のエピカーブの欠点
しかしエピカーブ自体にも問題があります。
検査陽性者の全数をカバーしていない(日本の場合)
まず発症日を確定することができない場合、その陽性者はエピカーブのデータに加算されません。
数理モデルを立てる意義
ここで数理モデルを立てます。この数理モデルは、実際に想定されるエピカーブを推定することを目指します。先ほど述べた不正確なエピカーブを、検査陽性者数から発症者数を推定するモデルを立て、補正します。
数理モデルから算出された推定エピカーブを用いれば、実際の発症者数がどれくらいいるのかざっくり知ることができ、また、先ほど述べたエピカーブの性質から、政策や行動変容の効果を検証することが可能になります。
そして数理モデルによって算出された推定エピカーブを実際のエピカーブと比較することで数理モデルそのものを評価すること、そして評価の結果最も妥当なモデルから導かれた推定エピカーブから、日本における緊急事態宣言や自粛の効果を検証しようというのが、今回の目的となります。
数理モデルの立て方:正規分布型と発症日分布型
では、どのようにして実際のエピカーブを推定するのでしょうか。
ここでは、正規分布型とエピカーブ型という2つの数理モデルを説明し、それぞれがどのようなデータになるかを説明します。以下、使用するデータはWHOのデータに基づく実際の日本の新規検査陽性者の推移を用います。
正規分布型:実際の感染者数を推定するモデル
この数理モデルでは、「実際の感染者数」を推定することを目指します。エピカーブは発症者のグラフなので、性質が異なりますが、その良し悪しについては後程議論します。
まず最初に、日本全体の新規検査陽性者の推移のデータを用意します。
発症日分布型:実際の発症者(エピカーブ)を推定するグラフ
この数理モデルでは「実際の発症者数」を推定することを目指します。おおむね手法は同じなのですが、先ほどは感染者の推定を正規分布で行ったのに対し、発症日分布型では発症者の推定を実際に得られた(検査陽性確定日-発症日)のデータのヒストグラムを用いて行います。
これを確率密度関数に変換します。
あとは正規分布型と同様の作業を行い、実際の発症者の推定グラフ、つまり推定エピカーブを得ます。
こうして推定エピカーブを得ることができました。このグラフも正規分布モデルと同様の理由で、4/9以降のデータを得ることはできません。
数理モデルの評価:エピカーブとのフィッティング
さて、どちらの数理モデルがより有効といえるでしょうか。すでに得られている実際のエピカーブと比較して評価していきたいと思います。
正規分布型(推定感染者数)
先ほどは青棒で示した推定値を、比較しやすいように折れ線グラフで表しています。感染初期の3月中旬ごろまではよくフィッティングしているように見えますが、それ以降は大きくずれています。
原因として真っ先に考えられる要因は、ウイルスの潜伏期間です。エピカーブは発症日のグラフなので、感染者のグラフよりも感染拡大の状況が遅れて反映されると考えられます。
また、先ほど述べたエピカーブ自体の問題点(全数を把握していない)なども、フィッテングが上手くいっていない要因と考えられます。
発症日分布型(推定発症者数・推定エピカーブ)
続いて発症日分布型です。実際の発症日分布をもとにしていることもあり、エピカーブとのフィッテイングは正規分布型と比べてはるかに良好です。4月以降のフィッティングがずれているのは、先ほど述べたエピカーブ自体の問題が要因として考えられます。
しかし発症日分布が正規分布よりもなめらかではないため、このモデルで出力される結果も正規分布モデルより滑らかではないという問題点があります。
いずれの数理モデルも、エピカーブ自身の問題により、どれほど正確に推定できているかを測ることは現状難しいと言えます。
両モデルの利点・欠点
正規分布型
・発症日分布が十分に得られていない国・地域に適応できる
・ウイルスが発症前から感染力を持つ場合、実際の感染者数推定が重要になるため、有用性が増す。
・検査時間や検査条件などで発症日分布が大きい場合に正確性を欠く。
発症日分布型
・エピカーブが十分に得られている国では、実際に得られたエピカーブにフィットしやすい。
・ウイルスが発症してから感染力を持つ場合、実際の発症者数推定が重要になるため、有用性が増す。
・発症日分布が十分に得られていない国・地域では機能しない。
緊急事態宣言の効果検証:推定感染者・発症者の増加率の推移から考察する
さてここからは、正規分布型と発症日分布型の両方を用いて、4/7に出された緊急事態宣言がどれほど効果を上げているのかについて、少ないデータから考察していきたいと思います。
まずは正規分布型から得られた新規感染者数の増加率(推定)です。黒棒は緊急事態宣言が出された4/7をプロットしています。
ここで重要な点は、増加率が1を下回っているか否かです。1を上回り続ける場合、感染者は指数的増加をし続けていることになり、感染拡大は止まらなくなります。逆に1を下回り続ける場合、感染者は指数的に減少し、やがて収束に向かうことになります。
感染者のトレンドは推定によれば4月頭には増加率1を下回ったように見えます。緊急事態宣言後の2日にはその増加率の減少はその前の数日に比べれば大きくなっており、まだ結論付けるまでの日数は足りていませんが、機能している可能性が見えます。
続いて発症日分布型から得られた新規発症者数の増加率(推定)です。黒棒は同様に4/7をプロットしています。
こちらについてはグラフの特性上、緊急事態宣言の効力について述べるのは時期尚早といえるでしょう。しかしながら、増加率を見れば緊急事態宣言後に1を下回っており、この傾向が緊急事態宣言の効果で促進される場合、終息への道筋が見えてくるかもしれません。
まとめ
今回は二つの数理モデルを用いて感染者数と発症者数が実際どのように推移しているのかを推測してみました。
まだ緊急事態宣言とそれに伴う行動変容が機能したかを評価するには時期尚早ですが、これらのモデルを製作することで、皆様が日々の報道に一喜一憂せず、根拠を持って冷静に事態を静観する一助になれば、と思います。
最後に数理モデルの実装データ(Excel)を置いておきます。参考までにご覧ください。
コメント