※ブログ記事の商品・サービスリンクにはアフィリエイトリンクが含まれます。

高血圧治療補助アプリ”CureApp HT”の臨床試験を読む

さて、2022年8月3日に高血圧治療を補助するアプリ「CureApp HT高血圧治療補助アプリ」が保険適応となり、話題となりました。

高血圧に関連した治療用アプリが承認されるのは初ですが、果たしてその効果はどうなのか。

普段みている脳梗塞治療の患者さんで高血圧の治療が必要となる方は多く(といっても後述するように血管疾患の既往がある人は臨床試験に含まれていない)この辺の話題は興味があるので、第3相試験であるHERB-DH1試験の論文を勉強しつつ内容を紹介します。

HERB-DH1試験の論文

さて、まず元文献とsupplementary appendixはこちらから。

Efficacy of a digital therapeutics system in the management of essential hypertension: the HERB-DH1 pivotal trial

またPMDAによる審査報告書も主に第3相試験による内容となっているので、まとまっていて読みやすいです。日本語でざっと内容を掴みたい方はこちらからどうぞ。

PMDA審査報告書

HERB-DH1試験の概要

HERB-DH1試験は日本でのオープンラベルの多施設共同ランダム化比較試験です。アプリを使う人を介入群とするため、盲検化はできないことからオープンラベルとなっています。参加施設は日本国内12施設で(supplementary Table S1.(B)に詳細あり)東京が主体ですがクリニックなどが多く含まれており、初めて高血圧が指摘された家庭医というリアリティのあるセッティングに近いと思われます。

PICO

まず、PICOからみていきますと

P:
・20-65歳
・収縮期血圧140-179mmHgまたは
拡張期血圧90-109mmHgの本態性高血圧患者
・ABPM(24時間血圧計)による収縮期血圧の平均値が130以上
・降圧治療はされていない
・スマホの使用が可能

主な除外基準
・二次性高血圧
・既往や併存疾患、脳心血管病リスクから直ちに薬物療法を始めた方が良い
・スマホを使用できない
など

I:
治療補助アプリの使用+高血圧治療ガイドラインに沿った生活習慣指導(199例)

C:
高血圧治療ガイドラインに沿った生活習慣指導(191例)

O:
試験開始12週時点もしくは12週時点より前の中止時点におけるABPMの収縮期血圧平均値のベースラインからの変化

となっています。冒頭に述べたように脳梗塞後の患者さんは除外基準の「直ちに薬物療法が必要」に当てはまることが多いため、この試験の内容を当てはめることはできないと言えます。

アウトカムの評価方法

詳細な試験の設計については事前にこちらのプロトコール論文が出ています。

A multicenter clinical trial to assess the efficacy of the digital therapeutics for essential hypertension: Rationale and design of the HERB‐DH1 trial

試験開始から4、8、12、16、20、24週時点で通院してもらい、12週時点で薬物治療を開始するかどうかが検討され、場合によって降圧剤の内服が開始されています。ABPMは主要評価項目となる12週、24週で測定されています。

統計解析手法

サンプルサイズはパイロット試験に基づいて以下のように計算されていました。

主要評価項目の予測効果量 5mmHg
有意水準 5%
検出力 90%
試験の予想離脱率 10%
→各群180名

解析対象は十分にサンプルサイズを満たしていたといえます。

また主要評価項目の解析はfull analysis setで行われ、統計的手法としては共変量を試験施設、降圧剤使用歴の有無、ベースラインの24時間収縮期血圧としたANCOVA(共分散分析)が用いられました。

HERB-DH1試験の結果

試験参加者の概要

flow diagram(Figure 2)
946名が評価され、そのうち390名が基準を満たし、ランダム化されています。「スマホが使えない」という除外基準で弾かれる人が数名単位で非常に少数なのは興味深いですね。地方によってはもっと多い気もしますが。

ドロップアウトは両群共に比較的少なく、通院できなくなったことが主な理由となっていて、介入群で7名、コントロール群で11名でした。また、12週のフォロー以降には半数弱が薬剤を開始しており、介入群78/192名、コントロール群87/180名でした。

・患者特性(Table 1)
年齢の平均値は両群ともに概ね52歳で、女性の割合が23%(介入群)、18%(コントロール群)と少ないようです。24時間収縮期血圧の平均値は約144mmHgと対象者全体の中では低めであることがわかります。脳出血、脳梗塞、心筋梗塞といった疾患の方は全く含まれていません。

主要評価項目の結果

まず主要評価項目である24時間収縮期血圧の平均値におけるベースラインからの12週後の変化は以下のようでした。

介入群 vs コントロール群
-4.9 vs -2.5 mmHg

その差は-2.4mmHg(95%CI -4.5-0.3, p=0.026)

となっています。

また副次評価項目(Figure 3)として日中、夜間、家庭、病院測定での収縮期血圧も並べられていますが、いずれも介入群で好ましい結果となっています。差は-2.3~-4.3mmHgほどですが、有意差もある程度付くほどとなっています。

また、拡張期血圧やより長期(24週後)の結果はFigure 4およびsupplementary appendix(Figure S4-S8)にありますが、家庭血圧および病院での血圧の変化のみをみています。朝夕の家庭収縮期血圧では有意差が付くほどの大きな差が出ていますが、他の組み合わせではいずれも介入群が好ましいものの有意差が付くほどではありません。論文中のFigure 4には最も差が顕著であった朝の家庭収縮期血圧の推移のみが載っていますが、これは結果の最も良いものを切り出すいわゆるCherry picking的な要素もあるので注意が必要です。

本来24週時点でのABPMの方が正確性を考えると重要な指標であるように思われますが、こちらはSupplementary appendixのTable S3に記載されています(なぜかグラフにもされていない)。全群比較での差は-1.8mmHg(95% CI -4.1~-0.5, p=0.12)となっています。

ただし24週での比較で注意が必要なのは12週時点から被験者によっては降圧剤が開始されている点です。両群で内服薬を開始したグループ同士での比較というのもされていますが、使用された薬剤の量や種類で補正されているわけではないので純粋にアプリの効果を測ることができません。これは全体の差を見るときにも影響が出ますので、24週時点では効果がなくなった、と言うこともできません。ただ、24週では効果が減少した可能性はあると言えるでしょう。

なお、導入された降圧剤の種類はTable S2にまとめられており、使用された割合としてはやはりコントロール群の方が多かったようです。しかしながら、open-labelの試験ですので、バイアスの問題があり、コントロール群の方が薬剤を使っている=アプリの使用で薬剤の使用が減る、とまでは言えないことに注意が必要です。ちなみに、こちらも朝夕の家庭収縮期血圧では大きな差が出ていますが、他は概ねあまり差はありません。

また、サブグループ解析(Figure 5)ではベースライン時点で収縮期血圧が145mmHg以上と以下で区切った場合によりベースラインが高い血圧の場合にアプリでの治療補助の効果が高い結果となっていました。

以上の結果をまずまとめてみますと

・12週後の降圧剤を使用しない状況下の比較では介入群で-2.4mmHg(95%CI -4.5~0.3)の降圧効果が得られた
・24週後の降圧剤を使用した状況下の比較では介入群が好ましい結果もあるものの、差が明確でない部分も増えた

というところでしょうか。24週以降の中期的な降圧効果が果たしてどうなのかはまだ不明です。

この辺りはPMDAの報告書でも指摘されていまして、アプリのみによる長期効果が不明であることから医師の管理下のみでの使用を義務付けています。医師が診ていない状態で長期にわたってアプリのみで降圧を期待することは、かえって患者の不利益になる可能性があるのですから当然ですね。

得られた効果量とハードエンドポイントとの関係

さて、ここからは実際論文で確認された効果ってどうなの?というところを掘り下げてみたいと思います。

まず、そもそも気になる点は今回得られた血圧低下というのはいわゆる代用エンドポイントであるということです。我々が本当に知りたいのは血圧を下げることで、「心筋梗塞・狭心症・脳梗塞」あるいは「死亡」といったハードなアウトカムを減らすことが最終的な目的です。

ハードアウトカムは基本的に発生が稀なので、今回のような保険適応を通す段階の臨床試験でその差がわかるようなことは当然ありません。

となると、いかに今回得られた降圧効果とハードエンドポイントが結びつくかを示すことが大切になるわけです。

さて、ここでPMDAの申請書類をみてみますと、申請者側が提示した論文とPMDAが提出した論文が示されています。それぞれ簡単に目を通してみます(が一つはアクセス権の問題で読めませんでした、、、)。

まず、申請者側から示されたのは大規模なコホート研究で観察開始時点での24時間測定の収縮期血圧・拡張期血圧とアウトカムの関連を示した論文でした。

Ambulatory Hypertension Subtypes and 24-Hour Systolic and Diastolic Blood Pressure as Distinct Outcome Predictors in 8341 Untreated People Recruited From 12 Populations

PECOを簡単に確認すると

P:12のコホートからランダムに収集した8341名の未治療高血圧患者
E/C:観察時点での24時間測定での収縮期・拡張期血圧
O:死亡、致死的心血管イベント、非致死的心血管イベント

というものとなっています。結果としては中央値11.2年の期間で観察したところ拡張期はやや関連性が弱いものの、収縮期血圧では関連性が認められています。ただ、果たしてこのデータから降圧による治療効果がわかるのかと言われると、少なくとも正確な予測はできないように思われます。

そもそも研究デザインとして、観察開始時点での血圧でその後のイベントの予測をするというものなので、「開始時点の血圧が低い分、その後のイベントが少ないこと」と「治療によって血圧を下げた分、イベントの発生率が減ること」は別のことと言えます。もちろん生活介入によって血圧を下げた分イベントの発生が減ることをみた研究というのはないので、しょうがないところではあるのかもしれません。元々のアプリの公式サイトにも2.4mmHgの血圧低下は10.7%の心血管イベント低下と書いてあったように思ったのですが、そこまでは明確に言えないのではないでしょうか。

血圧を下げた分のイベントの減少をみるという意味では、PMDA側が引用していた論文の方が近い意味合いを持つと思われます。降圧剤のランダム化比較試験における降圧作用と心血管疾患イベントの関連を統合して調べたメタアナリシスです。

Pharmacological blood pressure lowering for primary and secondary prevention of cardiovascular disease across different levels of blood pressure: an individual participant-level data meta-analysis

各種降圧剤の降圧効果とそれによるイベントの減少を調べており、メタ回帰分析の結果から収縮期血圧10mmHgの低下につき、メジャーな心血管疾患の減少(RR 0.80, 95%CI 0.77-0.83)、冠動脈疾患の減少(RR 0.83, 95%CI 0.78-0.88)、脳卒中の減少(RR 0.73, 0.68-0.77)、心不全の減少(RR0.72, 0.67-0.78)が得られたとされています。

これを参考にすると、先ほどと異なり降圧という治療により重篤なイベントの抑制効果があるように思われますが、注意すべき点がいくつかありそうです。

まず気になるのは、このメタ解析は薬剤による血圧低下を対象としている点です。今回のアプリによる血圧低下の効果は主要評価項目において生活習慣の改善(およびホーソン効果?)が主体です。薬剤による低下ではないため効果が異なる可能性は十分にあります。この論文においてもβ blocker, Ca blocker, ARB, 利尿剤で効果の違いが指摘されており、薬剤と同様の効果が得られるのかどうかは不明です。

ただ、長期的にアプリを使用した場合、薬剤のコンプライアンスがそれにより向上する可能性もあるため、むしろ内服を含めて長期的に使用した場合、さらに効果が高まる可能性もあるとも言えます。

もう一つ気にかかるのは、血圧低下によるリスク軽減の効果が線形なのかどうかという点です。このメタ解析のFigure 2では横軸に低下した収縮期血圧の量、縦軸にイベントのリスク減少をとり、Meta regression plotとともに回帰した直線が引かれているわけですが、あくまで血圧低下の量とリスク低減効果が直線的な関係であることを仮定した上でのものなので、果たしてこれが正しいのかどうかはわかりません。効果量が小さい場合に変化が小さくなってしまう可能性もあるでしょう。

また、HERB-DH1の論文本文のintroでも降圧によるリスク低減効果を示した論文が提示されていますが、こちらも上のメタ解析と同様に降圧剤による血圧低下とリスク減少の関連をみた論文なので、同じ問題を抱えていると言えます。

Blood pressure lowering for prevention of cardiovascular disease and death: a systematic review and meta-analysis

ここでの話をまとめてみますと、降圧による重篤な疾患のイベント減少は期待されますが

①生活習慣是正によるリスク減少効果
②降圧剤そのものによる(血圧低下以外の)リスク減少効果
③アプリによる薬剤のコンプライアンス向上の兼ね合い

がいかほどか不明であるために、長期的なアウトカムは不明瞭と言えるのではないでしょうか。

今後着目したいこととしては適切な対照群を傾向スコアなりの手法でマッチングした上で長期的にそれぞれどういった効果が得られるかをみていくことでしょうか。

長期使用で予想される問題

ハードエンドポイントと代用エンドポイントの問題以外に長期的な使用において不安な点はいくつかあります。

まず誰もが気になるのはアプリの使用のドロップアウトではないでしょうか。

今回の試験でのアプリ利用率は12週後で98.06%、24週後でも96.24%とかなりの高値を誇っていました。しかしながら、ランダム化比較試験に参加するような厳選された患者層ということを考えると、実臨床ではもっと離脱してしまう可能性は高くなることが予想されます。

日常的な感覚として、自分が健康関連のアプリを使用したとき、果たしてどこまで長期的に使えるかというと、半年(約24週)はまだしも1年は厳しいのではないでしょうか。実際は、かかりつけ医との連携となるため、もっと続けられる可能性は十分ありますがやはりここは人によって差が出てしまうように思います。

ちなみに Hypertension Researchという雑誌にこの治療におけるコスト削減・QALYの効果を推測した論文が挙げられており、離脱率も予想した上でのモデルが組まれています。

Cost-effectiveness of digital therapeutics for essential hypertension

attrition rate(離脱率)が半年で10%と予想されていますので、ここも織り込んで効果があるなら、どんどん導入していく方向に進むかもしれません。あくまで国としては良い、という話で、個人としては続けられなければ意味がないわけですが。

保険点数が治療開始時140点、月1回・6ヶ月まで830点と高いことが話題となっていましたが、これも本当に長期的なコスト削減効果があるのであれば、良いのかもしれません。

中医協総会 CureAppの高血圧治療補助アプリは「新規技術料」で評価 使用実態のフォローアップを

ただ、このコストに対しての効果は上述のように中長期的な効果がかなり不明瞭なことを踏まえると、取らぬ狸の皮算用で終わってしまう可能性もあり、また患者さんに本当に利益があるかも不明瞭ではあるため、今のところは安易にどんどん導入するものでもないのでしょう。

もう一つ長期的な使用で気になる点は、そもそもの社会全体の生活習慣が変わってきた場合に、効果が変わってくる可能性はあるのではないでしょうか。

つまり、社会全体の生活習慣がアプリの効果によらず徐々に血圧低下につながる方向に変わってきた場合、アプリによる降圧効果は薄まってしまう場合が考えられます。例えば減塩やBMIが一つの効果として副次評価項目に挙げられていますが、日本人の食塩摂取量は緩徐にですが低下方向にあります。この減塩の傾向を今後も厚生労働省などが進めていく場合に得られる効果が低くなる可能性はあります。

国民健康・栄養調査 厚生労働省

長期的なアウトカムによる恩恵やその調査をする場合、5-10年といった長いスパンを考える必要があります。そうするとこういった変化も十二分に影響を及ぼすことになるでしょう。同時期の対照群を置くとしても経時的な効果の変化がないかは注意が必要そうです。

まとめ

私見も含めて今回の内容をまとめますと

・現在アプリでの介入で有効性が明確なのはベースラインから12週後のABPMにおける収縮期血圧 -2.4mmHg(95%CI -4.5~-0.3)というもの
・24週後や降圧剤の併用した場合の中期的な効果は好ましそうであるがまだ不明瞭
・長期的なハードエンドポイントはまだ不明瞭で予測に十分な情報はない
・実臨床における長期的な使用では、ドロップアウトの問題や降圧剤との兼ね合い、コンプライアンスへの影響、生活習慣の変化に着目したい

というところでしょうか。今回のアプリを皮切りにこういった生活管理に踏み込んだ治療介入が進んでいくのか、あるいは十分に効果を上げられず後退するのか、まずは半年以降の中期的な次の報告が非常に気になるところです。