COVID-19 に AI/機械学習で挑む

2020/04/08

執筆者:

· 推定読書時間 3 分

はじめに

日本全国各地、及び世界の多くの国で拡大を続ける COVID-19 に挑む人達を支援するために、DataRobot は自社のエンタープライズ AI プラットフォームを、COVID-19 に対するワクチン・治療薬の開発、COVID-19 に対応する医療機関のオペレーション向上、社会における感染拡大の防止を目的とする分析を行う分析者向けに無料で提供することを発表しました（DataRobot、新型コロナウイルス関連の分析支援としてプラットフォームを無料公開）。

本ブログでは、この状況下でAI/機械学習の活用可能性について言及します。具体的には、医療資源割り当ての意思決定を支援するために、COVID-19 に感染された患者が重症・重篤化するかを予測するモデルを作成する世界中の取り組みや、DataRobot の取り組みをご紹介していきます。

実際に実運用に使える予測モデルが完成している状況ではありませんが、私達は DataRobot が貢献できる可能性を発信していくことで、協力してくださる方を集い、一緒に COVID-19 に挑みたいと考えています。

重症・重篤化予測の必要性

米国の一部地域やヨーロッパのいくつかの国では、すでに医療資源が限界に達しており、治療の優先順位付けが余儀なくされています。WHO はすでに世界的にトリアージ体制を提案しており[1]、日本においても新型コロナウイルス感染症対策専門家会議が2020年3月19日の会見で、限られた医療資源の中で重症者を優先する医療体制を構築する必要性を提言しています[2]。

感染が確認された症状のある人の約80％が軽症、14％が重症、6％が重篤と報告されていますが、重症・重篤化する患者も、最初は普通の風邪症状（微熱、咽頭痛、咳など）から始まっており、初期の段階では重症・重篤化するかどうかの区別がつきにくいという現状があります[3]。

これら喫緊の課題に対して、COVID-19 に感染しているかどうかの予測だけではなく、

オンラインのチャットボットのような形式で、大量の問合せの中から重症な患者、または重症・重篤化する確率が高い患者をスクリーニングするシステム
地域のかかりつけ医や初診の医療スタッフが初期症状からその患者が重症・重篤化するかどうかを予測し、専門機関への輸送優先順位付けを支援するシステム
感染症治療の設備が整った専門機関で、患者が重症・重篤化するかどうかを予測するモデルで医療資源の割り当て決定を支援するシステム

などが求められており、実際にその国の状況に合わせた取り組みが進められています。この記事では、重症・重篤化するかどうかを予測する早期スクリーニングシステムや専門機関内で治療の優先を決めるトリアージシステムにおいて、どういったモデルやデータが期待されるかについて述べていきます。

重症・重篤化を予測する早期スクリーニングシステム

COVID-19 に感染した場合に報告されているような症状が出た方は直接大きな病院に行かずに、地域毎に開設されている専門機関やかかりつけ医に行ったり、電話等で連絡してから受診することが多くの国で義務付けられています。医療資源がより深刻な問題になると、この体制がうまく機能しなくなり、初期診断を行う患者の優先順位付けが求められるようになります。アメリカでは Providence St. Joseph Health system や Partners HealthCare といった機関がすでにオンラインのチャットボットのような形式で大量の問合せの中から重症な患者、または重症・重篤化する確率が高い患者をスクリーニングするシステム構築に向けて動いています[4]。

感染症の治療設備が整った専門機関の治療許容量は一般的に初期診断の許容量より更に限られているため、初期診断のスクリーニングだけではなく、初期診断の際に医療スタッフが感染症の治療設備が整った専門機関へ輸送する優先順位付けを行うためのスクリーニングシステムの構築も求められています。

初期段階で重症・重篤化するかどうかを予測するモデルを構築する際には、年齢や性別、既往歴、持病有無、喫煙習慣有無、初期症状、渡航歴などの自己申告や初期的診断で取得することが可能なデータだけを使用する必要があります。目指すシステムごとに予測に使うことができるデータは異なるため、使用するデータには細心の注意が必要です。

Github に公開されているデータ[4]を元に、感染後退院/逝去の状況がまとめられた 31ヵ国 838例の COVID-19 の患者データ使用して DataRobot が分析した一例を示します。この例では、医療スタッフが初診でその患者が重症化するかどうかの意思決定を支援する予測モデルを想定しています。

表1: 一部データ例

重症化したことを示す「severe」を予測のターゲットとし、初期診断の段階から明らかに急性呼吸不全などの重症な患者は除外しました。年齢や性別、慢性的な疾患の有無、初期症状、渡航歴などの初期的診断で取得可能なデータだけを用いて予測モデルを作成しました。下記、今回のデータセットの簡単な説明です。

重症化した患者は 172人（20%）
主要な国の割合としては中国が30%、フィリピンが10%。日本は2%
10代からのデータが集まっており、30代が最も多く16%、50歳以上の割合は42%

このデータセットを使用し、AUC が 0.955のモデルを得ました。得られた結果をいくつか紹介します。重症化を示す「severe」と関係性の強い特徴量（モデルに使用する変数）とその度合いを表したグラフである特徴量のインパクト（Permutation Importance）を下記に示します。

図1: 特徴量のインパクト

図1をみると、年齢や症状、症状自覚から受診までの時間、持病などが重症化と関係性が高いという結果が得られました。特に年齢や症状、持病は現在世界中で報告されている結果と合致します。

図2: 年齢と重症化の関係

図2は年齢（横軸）と重症化確率（縦軸）の関係性を表しており、年齢が50歳以上の患者の重症化確率が高く、70歳以上になると更に重症化確率が高くなる傾向がみられます。

図3: 持病と重症化の関係

そして図3 は、持病の項目に記入された単語と重症化の関係性を分析した結果であり、字の大きさがその単語の出現頻度、そして色が重症化との関係性を示しています（赤色が濃くなるほど重症化確率が高く、青色が濃くなるほど重症化確率の低いことを示しています）。高血圧（hypertension）や糖尿病（diabates）、気管支炎（bronchitis）などの持病をもつ方は比較的重症化確率が高いという結果が得られました。

図4: 初期症状と重症化の関係

図4は初期症状の項目に記入された単語との関連性を分析した結果を示しています。呼吸器系の症状を訴える患者が比較的重症化する確率が高い傾向がみられます。

今回公開データを使ってモデルを作成した例を示しましたが、機械学習で作成したモデルを実際に現場で使用するためには、専門家のレビューを受け、更に運用体制について議論する必要があります。例えば症状が軽い陽性者等が、高齢者や基礎疾患がある人と同居していて家庭内感染のおそれが高い場合は、自宅以外の場所での隔離により接触の機会を減らすといった観点も考慮するべきでしょう。AIモデルはあくまで医療スタッフの意思決定を助けるツールであるので、国や地方の医療制度に合わせた使用体制の議論が必要となります。

モデルの精度の観点でもまだまだ改善の余地はあります。現状のモデルではAUCは0.955まで達しましたが、感度を90%にする際の特異度は83%となってしまいます。今回使用したデータでは初期症状が重要な特徴量として出てきましたが、全体のうち80%もの初期症状データに欠損があります。発症から診断の日数も今回の事例では重要な特徴量の候補として出てきましたが、発症した日とCOVID-19と診断された日付の両方が分かるデータは30%しかありません。システム構築を行う際には、こういった予測に重要である可能性の高いデータを精度高く、そして多く集める必要があります。質の高いデータが多く集まると、例えば「40代でも、ある症状と基礎疾患がある人の重症化のリスクは非常に高くなる」といったデータ内に隠れていたルール/パターンを見つけられる可能性があります。

現在日本のCOVID-19感染者の情報を収集し、分析するSIGNATEのプロジェクトをDataRobotは支援しています。上記のような欠損のあるデータでもある程度の精度のモデル構築が可能であったため、筆者達は国内で重症・重篤になった患者の初期段階での情報が集まれば、AI/機械学習を用いたスクリーニングモデルを構築できる可能性があると考えています。

専門機関内で治療の優先を決めるトリアージシステム

新型コロナウイルス感染症対策専門家会議は、入院の対象を COVID-19 に関連して持続的に酸素投与が必要な肺炎を有する患者、入院治療が必要な合併症を有する患者、その他継続的な入院治療を必要とする患者に絞ることを提示しています[2]。入院や治療の資源枯渇は、すでに深刻な問題となっており、受診した患者が重症・重篤化するかどうかを精度高く予測する必要性が今求められています。

ニューヨーク大学の研究者らは、患者の初期症状から重篤化する患者が患うARDS（急性呼吸窮迫症候群）を予測する AI の開発を早期段階から試みており、2020年3月30日に論文[6]を発表しました。この研究では、中国の 2つの病院の COVID-19 ウイルス患者53名のデータを用いて、初期症状から ARDS の発症を予測するモデルを作成しています。受診時の詳細なデータを使用し、予測に役立つ特徴量として肝臓酵素の血中アラニンアミノ基転移酵素（ALT）の濃度上昇、体の痛みの訴え、血中ヘモグロビン濃度上昇を報告しており、年齢や持病以外の重要な因子を提示したことで注目を集めた研究となっています。

世界中のトップデータサイエンティストが集う Kaggle においてもブラジルの医療機関のデータが公開され[7]、トリアージのモデル構築に向けて日々議論が行われています。

スクリーニング時と比較して、専門機関内で治療の優先を決めるトリアージシステムでは受診時に取得可能なデータを使用することができるので、受診スクリーニングモデルと比較して、精度が高くなることが期待されます。しかしながら事態が深刻になるにつれ、トリアージに求められる工数の短縮が求められるので、各国や各施設の現状、そして将来の体制をしっかり理解した上でモデルを作成することが求められます。また、トリアージモデル作成に向けては一般公開されていないデータがより重要になるため、医療機関との連携が更に必要となります。

図5: DataRobotで重症・重篤化を予測するイメージ

重症・重篤化の予測モデル作成された後、運用に使用可能なシステムを作成する必要がありますが、DataRobotでは図5のようなアプリの作成もプログラミングなしで簡単に行うことができます。冒頭にも申し上げましたが、弊社はCOVID-19を分析する方に、今回紹介したようなモデル作成や、アプリ作成を可能とする分析プラットフォームを無料公開しておりますので、一緒にCOVID-19 に立ち向かっていただける医療機関の方がいらっしゃいましたら covid-jp@datarobot.com までお問い合わせいただければと思います。