実際の論文をみつつ統計学習をしてきましたが
今回の論文についてはここでいったん最後です。
使用している論文がこちら
“Neck weakness is a potent prognostic factor in sporadic amyotrophic lateral sclerosis patients”
(, et al
前回までの記事はこちら
実際の論文から統計を学んでみる②-ログランク検定とは- – 脳内ライブラリアン
実際の論文から統計を学んでみる③-ログランク検定は何をしているのか-カプランマイヤー曲線 – 脳内ライブラリアン
実際の論文から統計を学んでみる④-ログランク検定は何をしているのか-超幾何分布 – 脳内ライブラリアン
今回は論文中のtable1, table2について。
table1では登録時の各筋群ごとで
Cox比例ハザード回帰でハザード比を出しています。
table2では過去の研究で明らかな予後予測因子を組み込んだ
Cox比例ハザード回帰で頚部屈筋のハザード比を出しています。
そこで「Cox比例ハザード回帰」について今回は説明してみます。
Cox比例ハザード回帰とは
①で書いた「比例ハザード性」を前提として
生存時間解析において回帰分析を行う方法です
そもそも回帰分析とは
あるデータを関数(要は数式)に当てはめて
結果を予測する方法の総称です。
回帰分析では基本的には得られたデータを使って
従属変数(結果)=説明変数(要因)の式
で表します。
生存時間解析の場合、時間の概念があるため
時間tをこの式の中に組み込まなければなりません。
ちなみにCox回帰分析は、単変量~多変量まで可能で
質的データ(男女、MRC score毎など)、量的データ(年齢、%VCなど)の
どちらも対応可能です。
今回の例でいけば
説明変数(得られたデータ)は「もともと知られている予後指標」
→登録時の年齢、性別、罹病期間、%VC、ALSFRS-R score、リルゾールの内服
球麻痺症状、revised El Escorial citeriaの分類
従属変数(結果)は「Primary outcomeのイベント数」と
そのほか解析したADL指標のイベントになります。
Cox回帰で使われる関数をみて、ざっくりしたイメージをつかみます。
Cox回帰ではある時点tにおける瞬間的な死亡率を
ハザード関数で表します。
被験者毎に説明変数(疾患の死亡率に影響する要因の有無や数値)が
違うため、その人ごとにハザード関数は異なります。
例えば、i番目の被験者のハザード関数を考えると式は
となっています。
xはそれぞれの説明変数
(今回の研究では既存の8つ+本研究で知りたい1つの計9つ)を表します。
βは説明変数ごとの影響の大きさを表し、偏回帰係数と呼ばれます。
はベースラインハザード関数と言われ
説明変数の要因が全て0である場合のハザードを表します
全てのxに0を代入すると分かると思います
何で式にexpが出てきたの?と言う理由は
単純に負にならないようにするためです
前述の通りハザードは瞬間死亡率なので
ハザードが負になるということはあり得ません
別にexpじゃなくてもなんでもいいかもしれませんが
logとったときに計算しやすいのでexpになってます
ここで大事なのは先ほどの比例ハザード性を前提として
関数が成り立っていること
式における
の部分はtに依存しない関数であることが分かります
つまり、
「tによらず一定の比例を保つ=比例ハザード性が成立」を前提にしています
あとは実際の回帰分析ですが
得られたデータからソフトを使って
具体的なβの値をそれぞれ算出します
この過程は難解すぎるので割愛します・・・
すると、たとえばβ1を算出できれば
がハザード比として求まります
こうして算出されたのがハザード比です
この部分がtに依存せず、比例をしている部分となります
論文の結論は
こうして回帰分析で出されたハザード比は
生存曲線どうしの平均的な傾きの比になります。
table1の結果から筋群の中では頚部屈筋が最も有力な指標であり
さらにtable2で過去の予後予測因子も組み込んだより正確(と思われる)モデルでも
有意差が得られており、頚部屈筋が予後の予測に有用であることが
示されています。
参考文献:「医薬統計のための生存時間データ解析」
コメントを残す