実際の医学論文から統計を学んでみるⅡ①-ELDERCARE-AF study/ IPCW法-

前にも同じようなことやりましたが、最近読んだ論文から統計学的な手法の勉強をしたので、再確認しつつ紹介します。

論文の内容自体は、脳梗塞に対するDOACのstudyですが、日本国内のstudyで、かつ高齢者への今までにないエドキサバン低用量投与という興味深いものだったので、内容も合わせて書きます。

以前の記事はこちら。

medibook.hatenablog.com

目次：

ELDERCARE-AF study
そもそも打ち切り例の補完はなぜ必要か
IPCW法(Inverse Probability of Censoring Weighting Method)とは
IPCW法の問題点

ELDERCARE-AF study

題材にする論文はまだ8/31に出たばかりのstudyで、今までエドキサバン（リクシアナ®）が処方されなかったような高齢者に対して投与したらどうなったかというものです。

論文はこちら

Low-Dose Edoxaban in Very Elderly Patients with Atrial Fibrillation

The Edoxaban Low-Dose for EldeR CARE Atrial Fibrillation patients trialなので略してELDERCARE-AFなようです。

対象者は80歳以上かつCHADS2 score2点以上の患者群のうち、通常エドキサバンを始めとしたDOACを出さないような背景因子（以下）

・CCr15-30

・出血性疾患の既往

・体重45kg以下

・抗血小板薬を内服中

・NSAIDs継続使用中など

の人に対して処方したランダム化比較試験です。めちゃくちゃ攻めてますね・・・。

用量は当然通常の用量より低く、15mg/日という少量です。

計984名を集め、観察の中央値は466日でした。primary outcomeは脳卒中もしくは全身の塞栓性イベントです。primary safety outcomeはmajor bleedingとしています。

結果はprimary outcomeがハザード比0.34 (介入群2.3%/人年 vs コントロール群6.7%/人年, 95%CI: 0.19-0.61, p<0.01)

対してprimary safety outcomeはハザード比1.87 (介入群3.3%/人年 vs コントロール群1.8%/人年, 95%CI: 0.90-3.89)でした。

secondary safety outcomeをみると、majorでなくても治療を要したclinically relevant bleedingがまあまあ多いのは気になりますが、、それでも本来不適格な高齢者に脳梗塞予防の道を開いた点では結構興味深いのではないでしょうか。

これだけの高齢者を集めてのstudyというのが日本ならでは！という感じがあって個人的には面白かったです。当然ながら第一三共（エドキサバンのメーカー）がスポンサーには入っているのはやむなしでしょうか。

ただ、このstudyで問題となるのは高齢者が多すぎるがゆえに、途中脱落の患者（＝censoring）が多いということです。そもそも脳梗塞起こさなくても他の原因で亡くなる場合があるのと、通院困難となる事例もあると思われます。各群ともに150名ほど抜けているので驚きの打ち切り率、約30%です、、、。

さて、こうした場合に役立つ方法がIPCW法（Inverse Probability of Censoring Weighting method）です。概念を紹介します。

そもそも打ち切り例の補完はなぜ必要か

IPCW法は打ち切り例（＝欠測データ）を補完する方法のうちのひとつです。

そもそもなぜ打ち切り例に補完が必要かという話ですが、打ち切りが完全にランダムに存在するする場合であれば問題ありません。問題なのは、臨床試験において実際はランダムではなく、打ち切りには何らかの要因が存在することが多いことです。

例えば今回の研究の打ち切り事例を想定してみると、80歳以上の超高齢者が主体の研究なので、何らかの疾患（転倒での骨折や認知症、介護者の高齢化）で通院自体ができなくなったり、あるいは癌や心不全、肺炎などprimary outcome以外の要因で亡くなること（競合リスクcompeting riskと呼ばれます）もあり得るわけです。

これらは明らかにランダムではなく、例えば少なくとも年齢とは関連性がありそうなことがわかります。

そうなると打ち切られた例には偏りが存在するため、解析に用いている打ち切られていないデータは実際の臨床像から乖離してしまう可能性が出るわけです。そこでIPCW法を始めとした補完方法が活用されます。

では、実際にIPCW法とは何をしているものなのか。

IPCW法(Inverse Probability of Censoring Weighting Method)とは

IPCW法は「被験者が観察される確率の逆数で被験者を重み付けた解析」（文献*1より引用）とあります。これだけで分かれば良いのですが、自分の場合はさっぱりだったので、より分かりやすく砕いてみていきます。

まず、打ち切り例と非打ち切り例について先に述べたように要因がどこにあるかを調べ、関連しそうなデータ（共変量もしくは回帰分析であれば説明変数と言われるもの）を見つけ出します。

例えば今回のstudyであれば別疾患による死亡や通院できなくなる疾患発症などがあるので、年齢は少なくとも共変量となることが推測されます。（実際は分かりませんが）

そこから打ち切りになる確率を推測するモデル（数式）を作ります。流れを図にまとめるとこんな感じです。

こうして作られた打ち切りになる確率を推定するモデルを使って、非打ち切り例の打ち切りになる確率を計算します。

例えば、ある被験者Ａについて打ち切りになる確率が80%だったとしましょう。

そうすると打ち切りにならない確率は1-0.8=0.2なので20%と分かります。

とすると、実際は被験者Ａと同じような被験者が結構打ち切られていた（80%の確率）可能性があることが分かります。

打ち切りにならない確率の逆数をとって1/0.2=5なので、あと「4人くらい同じような被験者がいたはずだけど打ち切られた」ことが推定されます。

この分をいわば水増しして、計算するのがIPCW法です。被験者Ａのデータは5倍に水増しされて、primary outcomeを算出するための計算に組み込まれます。

言葉にすると、最初に述べたように「被験者が打ち切られない確率の逆数をとって重みづけをする」ということになります。

こうして確認してみると、名前の通りで「打ち切り確率の（Probability of Censoring）逆確率（inverse）で重みづけ（weighting）をしたよ」ということですね。傾向スコアにおけるIPTW法と考え方としては似ています。

今回のstudyではそれによって打ち切り例の分も補正して解析を行っていますが、結果は変わらなかったようです。

IPCW法の問題点

想定できるだけでもいくつか挙げられます。

まず、最初の打ち切りになる確率を算出する統計モデルについて、推定がきちんとできているのかどうか。未知の交絡因子の存在や原因推定が不十分であると根底となるモデルに欠陥が起こります。

また、文献*2からの引用になりますが、IPCW法では、補正のやりすぎの問題が起こりえます。臨床現場においてコンプライアンス不良や通院の中断といった事象は実際に起こりうることです。それによって起きた打ち切り例も補正を行うとかえって過度な補正がされたことになり、生存期間やアウトカムについて実臨床的なデータとの乖離が起こりえます。

さらに競合リスクについてもこれは同様です。競合リスクによる死亡も実臨床上避けられない話なので、これを補正することは実際以上に生存期間を長く推定することにつながります。今回のstudyのように高齢者が主体であれば、なおさら影響が大きいので、効果については過剰な評価になっている可能性を考えないといけないように思います。

次回は同じ研究をネタにしてイベント数/人年データを用いたNumber Needed to Treatの算出方法について書きます。

(2021.06.28追記医学論文の読み方関係の記事はこちらにまとめました)

medibook.hatenablog.com

参考文献：

*1嘉田晃子, 松山裕, 佐藤俊哉ら著. 中止·脱落の理由を考慮した IPCW法による臨床試験データの解析. 計量生物学2002 年 23 巻 2 号 p. 81-91　J-STAGEへのリンク

*2 Howe CJ, Cole SR, Chmiel JS, Muñoz A. Limitation of inverse probability-of-censoring weights in estimating survival in the presence of strong selection bias. Am J Epidemiol. 2011;173(5):569-577. doi:10.1093/aje/kwq385　pubmedへのリンク