今回はMethods~Resultsにかけて、risk of bias(バイアスリスク)を中心にみていきます。
前回までの記事はこちら
実臨床に役立てるメタアナリシスの読み方① システマティックレビューとメタアナリシスの違い『なぜメタアナリシスのみはダメなのか』
実臨床に役立てるメタアナリシスの読み方② -Background編〜Methods編前半
実臨床に役立てるメタアナリシスの読み方③ -Methods編中盤①
実臨床に役立てるメタアナリシスの読み方④ -Methods編中盤②
まとめたページと参考文献はこちら
目次:
risk of biasの目的は?
ではまずrisk of biasとは何なのか、何のために評価されるものなのかを簡単に説明してみます。
risk of biasというのは名前の通り、バイアスが起きる危険性のことです。メタアナリシスに組み込まれる各研究がバイアスが起きやすい構造となっているのかどうか、それを評価するわけです。
初めの記事にも書いた通り、メタアナリシスは組み込む研究の質が低いと誤った結論を導きかねません。
実臨床に役立てるメタアナリシスの読み方① システマティックレビューとメタアナリシスの違い『なぜメタアナリシスのみはダメなのか』
それぞれの研究がどの程度質が高いのかを明確にすることで、まず結果の妥当性が分かります。質の高い研究が同じような結果を導き出すことができていれば、正しい結果である可能性が高いことが推測できますし、逆もまた然りです。
また、研究全体で質のばらつきがある場合、risk of biasが低い(=質の高い)研究を集めたサブ解析をすることで、全体での結果と変わらないか確認するときもあります。そうすることでも、結果の妥当性をある程度保証できます。
risk of biasが評価されていないメタアナリシスは結果の妥当性が極めて不明瞭となります。どんな質のものが含まれているのか分からないので、読む側がそれを個々に調べるしかありません。そんな不親切なことはあまりないとは思いますが、読む際に注意しなければいけないでしょう。
risk of biasの評価方法
では具体的にどのようにrisk of biasを評価するのでしょうか。
メタアナリシスを見るとこういう図をよく目にすると思います。
(8 Assessing risk of bias in included studiesより引用)
縦軸に「各研究」、横軸に「評価するポイント」が書かれており、緑や赤のマルでそれぞれ評価内容が表現されている表です。場合によっては色で評価内容を分けた棒グラフやただの文章のみの表であることもあります。これがrisk of biasを評価した結果となっています。
横軸の「評価するポイント」は著者のオリジナルではなく、概ね決まった評価方法が採用されます。ランダム化比較試験では、ガイドラインでよくみられるGRADE systemやコクランで使用されるversion 1 of the Cochrane risk-of-bias tool for randomized trial(通称RoB1、上の表はこれです), RoB2などが存在します。観察研究においても同様にさまざまな評価方法があります。
今回の記事では、その代表的な例としてRoB2を紹介します。他の例に関してはどんな風なのか知りたい人のために、こちらにリンクを貼っておきます。
・GRADE systemの評価方法
GRADE guidelines: 4. Rating the quality of evidencedstudy limitations (risk of bias)
・コクランの観察研究の評価方法(ROBINS-Ⅰ)
では、RoB2の内容を簡単にみてみます。まず、大まかに評価するポイントは以下の5点に絞られます。
- bias arising from the randomization process;
- bias due to deviations from intended interventions;
- bias due to missing outcome data;
- bias in measurement of the outcome; and
- bias in selection of the reported result.
(Chapter 8: Assessing risk of bias in a randomized trial | Cochrane Trainingより引用)
順番に見ていきます。
1. bias arising from the randomization process
ランダム化を行う時点で生じうるバイアスを確認します。ランダム化の方法が未知の予後因子を均等に配分できるように取られているのかどうか、またコントロール群・介入群のどちらに入っているのか被験者や試験の協力者にバレてしまうような分かりやすい割付がされていないか、といった点を評価します。
予後因子が均等でなければ、そもそも介入群とコントロール群で違いがついてしまい、介入の効果以外に結果が偏りうる要素が出てしまいます。またどちらの群に入っているかがバレて、盲検化が外れてしまうと、介入群が良い結果を出そうとしてしまったり(いわゆるホーソン効果)してしまいかねません。
ただし、各群で偶然に起きてしまったばらつきについてはここでは評価をしません。そのため、サンプルサイズが小さいといったことも否定的な評価はされません。あくまで、系統的に起きた誤差のみについて評価する形を取ります。
2. bias due to deviations from intended interventions
これはもともと研究のプロトコールで意図されていた介入とは異なる要素によって生じる結果の偏りを指します。
まず、一つには指定された介入以外に結果に影響を与えうる介入が行われてしまう場合が考えられます。
例えば、糖尿病の治療薬で新薬とプラセボを比較した研究があったときに、新薬群では他の治療薬もたくさん使われていたら、どうでしょうか。結果は「新薬vsプラセボ」ではなく「新薬+治療薬vsプラセボ」となってしまい、何を比較したいのかわからなくなってしまいます。そのため、大抵の場合はプロトコールであらかじめ指定以外の介入をどうするかが定められています。
もう一つは治療に対するアドヒアランスの問題です。治療のアドヒアランスが不十分であれば、介入による実際の効果が確認できないと言えます。
3. bias due to missing outcome data
アウトカムのデータが欠測していることによる問題です。例えば、被験者が引っ越してしまったり、亡くなったり、試験を途中で拒否したり、様々な理由でアウトカムのデータが得られない場合があります。そうなると結果が歪んでしまいます。
例えば、治療薬とプラセボを比べたときに、治療薬の効果が得られる人とそうでない人に極端な差があったとします。効果が得られない人は途中で亡くなったり、試験の参加をやめてしまい、効果が得られる人だけ残ってしまうと、残った人だけで集めた結果は至極よいものになるでしょう。
実際、これらの欠測データはないままにして結果を計算するのではなく、何らかの方法で補完されることも多いです。
欠測データの種類やそれによる問題点は以前にまとめたので詳しくはこちらをどうぞ。
4. bias in measurement of the outcome
アウトカムの計測方法によって起こりうるバイアスを検討します。例えば以下のような影響の出方が考えられます。
1、測定方法そのものの問題
精度が不十分な検査をアウトカムの測定に用いると、アウトカム発生と判定するかどうかに誤差が生じやすくなります。アウトカムの判定に適した精度の高い評価方法が必要です。
2、測定を誰がするかの問題
アウトカムの判定をするのが被験者なのか、治療者なのか、別の評価者なのかといったことでも結果の判定は変わり得ます。盲検化が不十分な者が評価すると、介入群に良い結果を出そうとしたり、結果に影響が出ることは容易に想像できます。
3、いつ測定するかの問題
アウトカムの評価を定期的にするのか、何らかの自覚症状があったら調べるのか、といった違いでも結果は影響を受けます。例えば、介入群の治療が疾患そのものの治療ではなく、あくまで自覚症状を和らげているだけであるといった可能性も出てきます。
5. bias in selection of the reported result
結果が良いものだけ選抜されて報告された場合に生じうるバイアスについて検討します。
前回の記事で出てきたreporting biasのselective outcome reporting biasにも似ていますが、前回の報告バイアスでは基本的に報告されていないことに着目していたのに対して、今回の話は何が報告されているか、に着目しています。
報告されているアウトカムがきちんと事前に決められていたものかどうか、またアウトカムの評価方法や解析方法が複数とられていた場合に全てそれらが出されているかどうか、を確認します。
後付け解析で出された結果だったり、評価方法や解析方法の一部が抜粋されていると良い結果だけ持ち出されている可能性が出てしまいます。
全体の評価をまとめる
この5つの項目をそれぞれ”low risk of bias”, “some concerns”, “high risk of bias”の3段階で評価して、最終的に全体を同じ3段階で評価します。
全ての項目がlow riskであればlow risk of bias
一つでもsome concernsがあればsome concerns
一つでもhigh riskがある、もしくは問題になるほど多くsome concernsがあればhigh risk
となっています。
総合して図にまとめるとこんな感じでしょうか。
図 全体の評価の流れ
なお、改訂されたRoB2やGRADEシステムは、研究全体のバイアスの評価ではなくメタアナリシスで統合するアウトカムのみの評価をしています。上記のバイアスリスクは同じ研究でもアウトカムごとに異なる可能性があります。例えば、割り付けがわかった後で後付け解析したアウトカムであれば、解析者の盲検は外れてしまう、などの例です。アウトカムごとに評価をするというのは合理的な評価であるように思います。
最初に出てきた表はこうやって作られるわけですね。今回扱ったRoB2以外にも評価方法は多数あります。読む側がそれぞれの評価方法を一つ一つ全部知る必要はないと思いますが、何を見ているのかは何となく把握しておいても良いのかなと思います。
まとめ
・バイアスリスクでは各研究のバイアスの程度を評価する
・様々なツールで、それぞれの項目ごとにバイアスの評価をしている
次回は結果のばらつきの程度を評価する「異質性」について調べていきます。
次の記事はこちら
メタアナリシスについてより詳しく学ぶ①-fixed effects model, random effects modelと異質性-
コメントを残す