ja

NHS:集団医療のためのAIのスケーリング

NHSは、MLOps、モデルモニタリングなどにDataikuを活用しています。
 

Dataikuが2023年に開催したEveryday AI Conferenceのロンドンロードショーにおける講演で、Joe Zhang博士は、イングランドの国民保険サービス(NHS)がAIのプラットフォームとソリューションのプロトタイプを短期間で作成して導入に成功した事例を紹介しました。Zhang氏は、NHSのAIプラットフォームオーナー兼データサイエンティストであり、インペリアルカレッジロンドンのヘルスケアAI研究者でもあります。

→ Watch the Full Session Here

すべてはデータから始まる

同氏は次のように話し始めました。「昨年、NHSイングランドでは9万件のデータフローが発生し、7,000の医療機関を起点として、患者データを抽出、維持、使用する数百の組織へデータの流れがありました」Zhang氏は、大規模なエコシステムにAIソリューションをスケーリングして結合するというNHSの取り組みについて語りました。

 

これは大規模な驚くべきエコシステムであり、NHSがこの10年でデジタル成熟度を高めた証しです。20年前には想像もできませんでした。

 

臨床アルゴリズム研究における高度な進歩と併せて、NHSは「少なくとも10年前から夢に描いてきたパーソナライズされた医療のビジョン」に一歩ずつ近づいている、とZhang氏は説明しました。このビジョンは明確であり、集団における疾患の広がりを詳述するだけでなく、個人の疾患の予測もできるようにすることです。「特定の時点の個人について、その患者にとって最適な治療法と介入を特定することができます」

これは、NHSが非常に有望な未来に向かって進んでいることを意味します。医療エコシステムはほぼ常にリソースの制約があるため、患者の需要への最適な対応と精度の高い予防医療ターゲティングの向上に必要なリソースの予測と割り当ては、まだ初期段階にあります。

サイロの中のサイロ:断片化への対応

ただし、このような高い目標の達成には困難が伴います。Zhang氏はこれについて説明しました。「データフローでは豊富なデータが生成されますが、NHSのように大規模な集団医療AIをスケーリングしようとする場合、何千もの多数の組織がそれぞれ独自にデータを管理しており、完全に正当な利害が競合するという問題にぶつかります」NHSのデータは豊富にあるものの、断片化されているため、統一されたインフラストラクチャーや包括的なエンドツーエンドプロセスの構築という複雑な課題が発生します。

臨床AIの研究の多くは学術界で進められており、実際の活動の場である臨床の最前線からは遠く離れています。

問題への対応:AIの垂直統合

NHSが直面している巨大な課題については、多数のチームが解決に取り組み、複数の解決策を同時に進めています。解決策の一部は、一見無関係に見えるまったく別の業界から取り入れました。Zhang氏は、「私たちは、垂直統合という企業手法を手本にしました」と述べ、ラジオミクスの分野にAIと機械学習(ML)を活用する最先端の取り組みについて説明しました。ラジオミクスはラジオロジー(放射線医学)とは異なり、定量的に医療画像を分析してインサイトを得る手法です。「AIのライフサイクルのすべての要素をひとつにまとめました。ニーズの定義から、製品の開発、データの収集、モデルの開発、展開、展開後、本番稼働までのライフサイクル、そして効果の測定に至るまで、すべてを統合しました」

適切なテストベッドの選択

この包括的なデータ管理のビジョンを強固にするために、Zhang氏とチームはモデルをテストする適切な地域を選ぶ必要があり、ロンドン北東部を選びました。「ロンドン北東部を選んだ理由はいくつかあります。データ成熟度が非常に高いこと、強力で革新的なリーダーシップがあること、そして強力なデータエンジニアリング部門があることです」

Zhang氏はSnowflakeで構築されたこの地域のインフラストラクチャーについて説明しました。データサイエンティストは200万人の患者のリンクされたデータをこれに取り込むことができます。「このICB(統合ケア委員会)地域に臨床AI研究を導入し、Snowflakeに取り込む生データを読み取れるDataikuのローカルインスタンスを展開しました」

これをデータ前処理、プロトタイピング、製品開発に使用しますが、さらに重要なのは、使いやすいMLOpsを備えた展開プラットフォームとして、また、モデルを中心とする本番稼働インフラストラクチャーとして使用することでした。

ICBはNHSの委託組織であり、臨床サービスの料金を支払います。このグループには、集団医療パスウェイと統合ケアパスウェイが含まれます。Zhang氏とチームは、強固な基盤の構築に成功しました。「これにより、ニーズの特定や予防的予測、予測を必要とする人へのフィードバックなど、すべてを治療介入群の近くで行うことができます」また、このインフラストラクチャー環境全体がNHSイングランドの安全なデータ環境のコンプライアンス規則と規制に厳密に適合していることを同氏は付け加えました。

多変量病院負荷予測へのAIの統合

Zhang氏は次に、病院予測について説明しました。同氏はこれを、医療業界の課題に関する基本的な知識のある人にとっての「パンとバター(必需品)」であると述べています。NHSではこの種の予測を約20年前から活用していますが、従来はインフルエンザの繰り返し発生する季節的パターンに基づいていました。季節性インフルエンザの患者数の増加は、非常に信頼性の高い指標であるため、年間ベースの病院受診者数の推計に使用されています。呼吸器疾患が流行すると、救急需要と選択的手術の延期が増え、NHSに費用がかかることになります。

「新型コロナウイルス感染症の感染拡大以降、これはまったく役に立たなくなりました。突然、地域社会に複数のウイルスが出現して感染が競合するようになり、新しい疫学的パターンが生まれたからです」とZhang氏は説明しました。それでも、NHSのAIモデリングは、このような新しい可変要素が加わっても、データフローの一貫性と正確性により、病院予測の情報源として信頼性を維持しました。「リンクされた低遅延のデータフローを取り込んだプラットフォームでディープラーニングを採用して展開することができました。トランスフォーマーモデルによる多変量予測を使用しました」

NHSは、来院情報を含むプライマリケアデータを使って、患者の状況と発生日時、症状、障害、疾患を追跡し、入院の可能性やその他の環境変数に基づいて分類することに成功しました。その成果は、パンデミック(世界的大流行)の最中でもはっきりと表れました。

2週間後や1か月後の病院の状況や、外部からの影響を予測することができました。

重大な心血管イベントの予測

Zhang氏は、講演の次のセクションを大胆な発言で始めました。「ここでは、今後3年以内に心臓発作、脳卒中、腎不全になる患者を予測できます」同氏は、AIとMLで最適化することで、心血管リスクに関するNHSの標準モデルより精度を高めたモデルを示しました。このモデルはAutoMLを使用してトレーニングされており、使用する患者データに合わせて全面的に最適化され、データエンジニアリングによって完全にサポートされています。「これを、初歩的でありながら機能的なMLOpsとともに展開して、データの品質、コーディングパターン、取り込むデータの分布を監視し、ドリフトを検知できるようにしました。また、母集団だけでなく、地理的に異なる場所の母集団の部分集団における予測性能も監視できます」と同氏は述べています。

同氏は、Dataikuとのパートナーシップがこれらのモデルの実現に役立ったと語りました。「これらすべてを1つのDataiku本番環境に統合し、その出力を診療レベルだけでなく個人レベルのリスク予測にも利用できるようにしました。医療記録にアクセスできるため、治療最適化方法を特定できます」と同氏は付け加えました。

精度の高い集団医療

Zhang氏が紹介したもうひとつのユースケースは、母集団における多疾患罹患患者の経過と転帰を予測するためのNHSの取り組みです。NHSは、この地域の200万人の生涯記録にマッピングされた20,000の疾患概念を含むデータセットを使用しました。多疾患罹患とは、患者が2つ以上の長期慢性疾患を持っている状態を指します。チームはこの膨大なデータセットにMLを使用して、類似する意味を持つ疾患概念に分割し、さらにさまざまな進行と転帰のパターンのグループに細分化することを始めました。

「これらのグループを調べて多疾患罹患の経過を確認でき、民族や貧困度などの主要な人口統計学的グループ別に分類できます。その後、このデータを使用して、母集団別だけでなく、地域や主要な部分集団別に発病をモデル化して、予防医療介入のターゲットにすることができます」DataikuのSDoH(健康の社会的決定要因)ソリューションを活用したこの種の分析の詳細をご覧ください。

これは、非常に優れたデータと優れたインフラストラクチャーを活用して、一般には臨床研究で行うような作業を集団医療と潜在的介入の近くで行った場合の効果を示す一例です。

今後の取り組み:ロンドン保健データサービス

Zhang氏は、もう1つの有望な地域的インサイトとして、チームが現在ロンドンで進めているAIの取り組みについて紹介しました。「ロンドン北東部では、今年末か来年(本稿執筆時点では2024年)初めにロンドン保健データサービスの運用を開始する予定です」このサービスは、約2,000の医療機関と1,000万人の患者集団のデータを取り込む予定です。

このニュースは、NHSの分析とインサイトの次の段階を表しています。このサービスは、低遅延データを活用し、医療機関との強力なデータガバナンス契約と広範な公共アウトリーチに支えられ、人材の充実した専門家チームとロンドンの関係者によって開発されました。「1つの中央データレイヤーで、ロンドンの5つのICBだけでなく、地方の安全なデータ環境にもサービスとしてのデータを提供したいと考えており、これは今後、臨床とライフサイエンス研究の国内主要ノードの1つとなるでしょう」

パーソナライズされた大規模医療

非常に有望な見通しとすでに大きく進んでいる取り組みがある一方、とくに持続可能性と規制の面でまだ最適化できる領域があるとZhang氏は考えています。「私たちは規制当局と協力して、引き続き集団のニーズに責任を持ってモデルを作成できるようにしていきます」

ただし、その責任は規制を上回ると同氏は考えています。「それは、現場で展開できるプロセスに倫理的なAIと公平性の概念を組み込むことを意味します。モデルとその安全性、影響、公平性を監視し、効果的な方法で対応できる、強力な生産ライフサイクルです」ロンドンの著名な学術センターの専門家をスタッフとして配置することで、多様な視点から迅速でインテリジェントな監視と対応を確保します。

NHSは、NHSによって、NHSのために、NHSのデータに基づいて、NHSの患者についてトレニーニングされ、開発されたこれらのモデルのライブラリを構築でき、それをこの地域だけでなく、他の地域にも当てはめて、そこの集団にも適応させ、そこに展開できる可能性があります。

NHSが作成するモデルの継続的な検証は、集団の健康のためだけでなく、大規模な集団におけるAIとML技術のさらなる推進にとっても、長期的に有益です。

Zhang氏はNHSがここ数年で実現した成功を十分に認識していますが、この先にどのようなことが待ち受けているかも理解しています。「前途は有望ですが、まだ長い道のりが続きます」と同氏は述べています。

 

以下のインタビューは、ロンドンで開催されたEveryday AI Conferenceの際に行われました。

動画を視る
Interview of Dr. Joe Zhang, AI Platform Owner and Data Scientist at the NHS

セッション全体を視聴する

SEE IT NOW

Novartis:組織のアナリティクスとAIを合理化

NovartisはDataikuの導入により、それまでExcelを使用して手作業で行っていた反復的な計算作業を、正確でリアルタイムのデータに基づく意思決定へ転換しました。

Read more