FDA認可AIソフトウェア|小腸出血が疑われる患者のカプセル内視鏡画像の読影時間短縮支援

概要

NaviCam ProScanは、小腸出血が疑われる成人患者を対象に、カプセル内視鏡画像の読影を支援するAIソフトウェア(Class II、De Novo申請)であり、中国・武漢のAnkon Technologies社が開発した。

中国8施設の2,642例を用いてアルゴリズムを学習し、以下の2つで構成される。

  • ①消化管部位認識(口腔・食道・胃・小腸をカラー表示)
  • ②小腸病変認識(疑わしい病変をバウンディングボックスでマーキング)

あくまで臨床医の読影補助ツールであり、診断や臨床的意思決定の代替は意図していない。

スタンドアロン性能試験(病変検出機能)は以下

  • 患者レベルで感度98%、特異度37%(33/89)
  • 画像レベルで感度95.05%、特異度97.54%

臨床試験は以下の2件が実施された。

  • 後ろ向き評価(87例)では、ProScan使用時の読影時間が21.47分と、未使用時の58.10分から大幅に短縮された(p<0.0001)。
  • 主要な前向き多施設共同試験であるARTICスタディは、欧州7カ国7施設で133例を対象に実施。AI+医師読影と標準読影を比較した。AI+医師読影の診断率は73.7%(98/133)で、標準読影の62.4%(83/133)を有意に上回り(p=0.015)、エキスパートボードに対して非劣性を達成した。読影時間もAI使用で3分50秒と、標準読影の33分42秒から約90%短縮された(p<0.001)。

注目ポイント

ソフトウェア単体の病変検出機能の特異度について、「患者レベル(37%)」であり、偽陽性が懸念される

偽陽性の理由は判定基準

特異度の低下は、患者レベルの解析において判定ルールが厳しいことが理由とされている。ソフトウェアが、1人の患者の全ての画像データの中で「1つでも偽陽性」を検出した場合、その患者全体を「偽陽性」と判定するというルールで計算されているため。

カプセル内視鏡は、1人の患者につき数万枚の画像を撮影するが、画像レベルでの特異度が97.54%と高い数値であっても 、数万枚の画像をソフトウェアが解析すれば、「正常な画像を誤って病変(陽性)と判定してしまう偽陽性」が数枚は発生してしまう。

このような判定ルールにより、「たった1枚の偽陽性画像」が存在するだけでその患者全体が「偽陽性患者」としてカウントされてしまうため、患者レベルでの特異度が37%(=正常な患者を正常と正しく判定できた割合が低い)まで劇的に低下している。

単体性能試験の偽陽性の正当性

患者レベルの特異度が37%であることは、AIが多くの偽陽性予測を出すことを意味します 。そのため、AI単独の判定結果(陽性/異常)をもって自動的に小腸疾患の存在を確定することはできず 、臨床医がAIの検出結果を注意深くレビューして偽陽性を除外する必要がある

AI単独(スタンドアロン)では偽陽性が多発するものの、実際の臨床医がAIのサポートを受けて読影した臨床試験(ARTIC試験)では、偽陽性の患者は0人であった。

患者レベルの感度は98%と非常に高く、異常のある患者を見落とす(偽陰性)リスクは極めて低く抑えられています 。医療機器の性質上、「AIが異常の候補を少し多めに拾い上げて(特異度低下)、最終的に人間(医師)が精査する」という設計は、読影時間を大幅に短縮(約33分から約3分50秒へ短縮)できるというメリットと天秤にかけた結果、ベネフィットがリスクを上回ると判断されています。

詳細はこちら

1. 情報 (Regulatory Information)

製品名 NaviCam ProScan
一般名(Generic Type) Gastrointestinal Capsule Endoscopy Analysis Software Device
申請番号 DEN230027
申請種別 De Novo Classification Request
製品コード QZF(21 CFR 876.1540)
受理日 2023年4月14日
申請者 Ankon Technologies Co., Ltd(中国・武漢)

2. 使用目的 (Indications for Use)

小腸出血が疑われる成人患者のカプセル内視鏡画像のレビュー時間短縮を支援するAIツール。消化管部位(口腔、食道、胃、小腸)の識別も補助。臨床的意思決定の代替は意図していない。

3. デバイス概要 (Device Description)

2つの主要アルゴリズムで構成:

消化管部位認識:口腔・食道・胃・小腸を識別しタイムライン上にカラー表示

小腸病変認識:疑わしい病変をバウンディングボックスでマーキング

4. 非臨床/ベンチ試験の概要 (Summary of Nonclinical/Bench Studies)

アルゴリズム学習

中国8施設の2,642例のカプセル内視鏡データを使用

病変検出用に1,476例、部位認識用に1,386例で学習

スタンドアロンアルゴリズム試験

病変検出機能(患者レベル)

患者レベル:感度98%、特異度37%

画像レベル:感度95.05%、特異度97.54%

ゴールドスタンダード(GS):消化器専門医3名によるアノテーション(多数決+裁定専門家による確認)

GS: Normal GS: Abnormal
ProScan: Normal 33 2
ProScan: Abnormal 56 127

結果

感度 98% (127/129) (95% CI: 93.95%–99.71%)

特異度 37% (33/89) (95% CI: 27.27%–48.02%)

患者レベルの感度は高い一方、特異度が低く(37%)、臨床医による偽陽性の精査が必要。

病変検出機能(画像レベル)

ゴールドスタンダード(GS):同上(画像単位での病変有無をアノテーション)

GS: Normal GS: Abnormal
ProScan: Normal 14,743 179
ProScan: Abnormal 372 3,439

感度95.05% (3,439/3,618) (95% CI: 94.28%–95.72%)

特異度97.54% (14,743/15,115) (95% CI: 97.28%–97.78%)

消化管部位認識機能 — 画像レベル解析

ゴールドスタンダード(GS):消化器専門医3名による部位境界アノテーション(多数決+裁定専門家による確認)

混同行列

GS: Oral Cavity GS: Esophagus GS: Stomach GS: Small Bowel
ProScan: Oral Cavity 3,216 25 39 50
ProScan: Esophagus 11 704 5 24
ProScan: Stomach 5 10 17,215 306
ProScan: Small Bowel 2 1 48 2,986

感度・特異度(部位別)

Oral Cavity and beyond

感度99.47% (3,216/3,330) (95% CI: 99.14%–99.68%)

特異度99.50% (20,969/20,987) (95% CI: 99.39%–99.58%)

Esophagus

感度98.92% (704/740) (95% CI: 97.79%–99.50%)

特異度99.10% (23,256/23,472) (95% CI: 98.98%–99.22%)

Stomach

感度99.60% (17,215/17,607) (95% CI: 99.49%–98.69%)

特異度99.06% (6,164/6,227) (95% CI: 98.80%–99.26%)

Small Bowel

感度99.26% (2,986/3,366) (95% CI: 98.89%–99.51%)

特異度98.36% (20,943/21,294) (95% CI: 98.18%–98.52%)

全部位で感度・特異度ともに98%以上。

5. 臨床情報の概要 (Summary of Clinical Information)

後ろ向き評価

87例において、ProScan使用時の読影時間が大幅短縮(21.47分 vs 58.10分、p<0.0001)

ゴールドスタンダード(GS):ProScan ON/OFFの読影時間を直接比較(診断精度の比較なし)

ProScan ON ProScan OFF
平均読影時間(分) 21.47 ± 8.05 58.10 ± 45.28
p値 p < 0.0001

ARTICスタディ(前向き多施設共同試験)

欧州7施設137例を対象。

AI+医師読影の診断率(73.7%)は標準読影(62.4%)より有意に高く(p=0.015)、エキスパートボード読影に対して非劣性を達成。

読影時間も大幅短縮(3分50秒 vs 33分42秒、p<0.001)

ARTICスタディ 試験概要

項目 内容
試験デザイン 前向き多施設共同試験
試験目的 AI+医師読影の診断率(DY)がエキスパートボード読影に対して非劣性であることの検証、および標準読影との読影時間の比較
実施期間 2021年2月〜2022年1月
実施施設 欧州7施設(イタリア・フランス・ドイツ・ハンガリー・スペイン・スウェーデン・英国)
対象患者 小腸出血が疑われNaviCam SBシステムによるカプセル内視鏡を実施した成人患者
選択基準 小腸出血疑いの成人患者、NaviCam SBシステム使用
除外基準 文書不備、カプセル嚥下不可、デバイス技術的不具合(計4例除外)
症例数 登録137例、最終解析133例
患者背景 平均年齢66.5歳(±14.4)、男性60例・女性73例
読影者 欧州7カ国22名(全員カプセル内視鏡読影経験500例以上)
ゴールドスタンダード(GS) エキスパートボード読影(22名中5名で構成)による最終判定。不一致例は裁定により再分類
主要評価項目 P1+P2病変(Saurin分類)に対する診断率(DY):AI+医師 vs 標準読影、エキスパートボードとの比較
副次評価項目 AI+医師読影 vs 標準読影の平均読影時間
試験アーム ①標準読影(AI補助なし)、②AI+医師読影(ProScan使用)、③エキスパートボード読影(GS)

ARTIC Study 主要結果

GS陽性(P1+P2) GS陰性 診断率(DY)
エキスパートボード(GS) 105 28 133 78.2%(71.0%–85.5%)
標準読影(医師単独) 83 0 ※ 133 62.4%(53.6%–70.7%)
AI+医師読影 98 0 ※ 133 73.7%(65.3%–80.9%)

※ 偽陽性なし(標準読影:偽陰性22例、AI+医師読影:偽陰性7例)

読影時間比較

読影方法 平均読影時間 p値
標準読影 33分42秒(±22分51秒) p < 0.001
AI+医師読影 3分50秒(±3分20秒)

AI+医師読影はエキスパートボードに対して非劣性を達成し、かつ読影時間を大幅に短縮。標準読影と比較して診断率も有意に向上(p=0.015)。

小児への適用

本申請では小児への適用を支持する臨床データは提出されていない

6. ラベリング (Labeling)

デバイス説明、適応患者集団、使用説明を含む。過信への警告、診断代替不可の警告、臨床医による独立した評価の必要性を明記。ポストマーケットサーベイランスデータに基づきラベルを更新予定。