雑感「COVID-19の感染者数情報を有用な情報にする簡単な方法」

そろそろ記事でも書くか、と思って前回のエントリーした日付を確認したところ、3週間以上も経過していた。どこかでメイドインヘブンでも発動しているのではないだろうか。

そんなわけで今年ももう終わりが見える時期となったが、終りが見えないのがCOVID-19の感染拡大だ。その中で、COVID-19の情報と言えば、あいも変わらず本日の感染者数は何人でしただの、ワクチンの治験がはじまりました、いや始まらないだのといったものばかり。変わったのはコロナの女王の顔を見なくなったくらいか。まあテレビを全然見ないから顔すらしらんが。この状況を見るにつけ、あまり用をなさない日々の感染者数のデータについて、少しでも活用可能とするための方法について書くことにする。

日々の感染者数データがあまり用をなさないと考える理由は、「感染者数はあくまでも感染が発覚した数」であり、一日一日の変動があまりにも大きいから、日々のデータを追っても、それが一過性のものなのか何らかの傾向にあるのか見えないためだ。ある日の感染者数が200人、翌日が50人、その翌日が250人、その次が30人、と言われても、感染が拡大しているのか頭打ちになっているのか判断がつかない。それに、感染者数は医療機関での検査の結果が報告されるものだから、当然未受診の感染者は数に入らない。無症状の感染者も一定の割合で報告されているわけだから、余計に日々の変動を追っていても意味がない。”雑音”が多すぎるのだ。

次に、潜伏期間。この厚生労働省の資料では潜伏期間は感染から1日から12.5日で、多くは5、6日とのことだ(これとて「そうらしい」という確度の情報でしかないが)。よって、感染者全員が発症と同時に医療機関を受診したと仮定した場合に、ある日の感染者数は、だいたいその5、6日前にウィルスに曝露されていると考えられる。だが、こうした情報は特に強調されることもないから、何が原因で感染者が増えているのかを考える材料が不足する。これでは一人ひとりが感染リスクを抑えるような行動をせよと呼びかけても無駄であろう。正しく恐れよとしたり顔で述べるメディアも多いが、正しく恐れるための情報も提供しろ。

ではこの日々の感染者データを使いやすいように加工することはできないのかという疑問について、できないと言ってしまっては、ざんねんこのきじはここでおわってしまった!だとか、キジガ オワッチャッタ!ミンナガ キタイシテタノニ ワリト ヤクタタズ…と言われかねないが、もちろんやり方はある。移動平均をとるのだ。

デイトレーダーには馴染みの知識だが、日々の変動が大きいデータの場合は、その日のデータの前後何日かのデータの平均をとってプロットすることで、日々の変動のギザギザをなめらかにし、よりトレンドをつかみやすくすることができる。これを移動平均をとる、と言う。その際に、何日分を平均するかによってなめらかさが変化する。よく使われるのは起点となる日をはさんで前後2日分、つまり全部で5日間分のデータを平均する移動平均(5日分なので5項移動平均と言う)や前後3日分の7日間分の移動平均(同じく7項移動平均と言う)だ。この考え方を使って、東京都の感染者数のグラフを描いたものが次の図である。

f:id:Yochida:20201116172139p:plain

COVID19の東京都の感染者数(元データは東京都のサイトより)

青色のグラフが日々の感染者数、オレンジ色のグラフが5項移動平均をとったもの。こうしてみると、8月に山が来て、9月から10月までは感染者数の減少があり、11月に入って山がきつつあることがわかる。5項移動平均をとった理由は、感染から発症まで5、6日というところから、これくらいの粒度が適切かと思ったからだ*1

グラフには追加情報として、ぱっと思いつく感染に影響を与えそうなイベントを描きこんでいる。GoToキャンペーンは当初東京は除外されていたので、8月の山の説明にはならないが、4連休や夏休みといった要因でこの山を説明できるだろう。お盆の時期は感染者数が減少しているから、この時期はいいつけを守って故郷に帰ることなく、家でじっとしていたのかもしれないが、その前に遊んでいては意味がない。

9月の4連休はそこまで大きな影響を及ぼしていないようだが、このあたりは天気がパッとせず、ときおり雨だったので、そうした影響で外出が控えられたのかもしれない。そして注目すべきは11月の新たな山の直前のイベントだ。自粛が呼びかけられていてもなおハロウィンとかいうよくわからないイベントに参加するアホが多かったようだ。例年より混雑が少なかったとは言え、かなりの人間が蝟集したと聞く。そしてその5、6日後から急激にグラフが上昇しているのは、果たして偶然なのだろうか?

あ、最近めっきりプレミアムフライデーという言葉を聞くことがなくなったが、COVID-19の感染拡大にもとくに関連していないことが先程のグラフを見てもよくわかる。マジで無意味なキャンペーンであることが証明されちまったようである。

*1:ちなみにデータ引用元の東京都のwebサイトでは、7項移動平均のグラフが掲載されている。テレビでこれを掲載しない理由がわからない。テレビで感染者数を知った人間がわざわざ東京都のwebサイトで改めて情報を確認するとは思えないから、テレビが正しい知識を得る機会を邪魔していると言えなくもない。