今回は2021年の医薬生物学問1をみていこうと思います。毎年一問は出ている生存時間分析の問題でした。競合リスクを考慮したモデルの問題ですが、2019年のRMST法と同様、応用的な分野なので誘導がしっかりとついています。本番ではそれにも関わらず計算ミスで残念な結果となりましたが、、、。順番に見ていきましょう。
[1]
まずはど定番のハザード関数の定義と生存関数の関係式の問題。過去記事に同様の式変形がありますのでこちらを参照してください。
【統計応用・医薬生物学】ハザード関数と生存関数の関係性を整理【統計検定1級対策】 – 脳内ライブラリアン
[2]
カプランマイヤー法で生存関数を描く問題ですね。これもまた定番です。今回は縦軸が\(1-S_1(t)\)なので徐々に上がっていくタイプの曲線となります。
こちらも過去記事で取り扱いましたのでカプランマイヤー推定値についてはそちらをどうぞ。
計算を一応見ていきますと、10年時点で初のイベント発生があります。直前のリスク集合は3人打ち切りがあるため5人となり、イベント発生は1人なので
\(1-S_1(10)=\frac{1}{5}\)
続いて12年時点では直前のリスク集合は4人、イベント発生は1人なので
\(1-S_1(12)=1-\frac{4}{5}・\frac{3}{4}\\=\frac{2}{5}\)
次の14年時点では直前のリスク集合は3人、イベント発生は1人なので
\(1-S_1(14)=1-\frac{4}{5}・\frac{3}{4}・\frac{2}{3}\\=\frac{3}{5}\)
となります。
最後の18年は打ち切りがあり、リスク集合が1人、イベント発生も1人のため0となるので縦軸は1になります。
以上を描画すればおしまいです。
[3]
さてここからは競合リスクを考える問題です。まずは累積イベント発現関数Fをいずれのイベントも発現していない場合の生存関数とハザード関数で表現する問題。定義に戻って考えた場合も、生存関数の意味は[1]の場合と実は変わっていないため
\(\lambda_j(t)S_2(t)=f_j(t)(j=1,2)\)
となります。あとは両辺を積分して
\(\int_0^{t}\lambda_j(u)S_2(u)du=F_j(t)(j=1,2)\)
が答えとなります。
[4]
競合リスクモデルでの累積イベント発現関数の推測値を定義に沿って求めていく問題です。
上から順にひたすら計算して求めていけば答えが出ます。
\(n_{ji}\)はひたすら下にいくにつれて減るので(あ)6(い)5、あとは4,3,2,1で埋めることができます。
他は生存関数S、累積イベント発現関数Fを上から順に埋めていきます。
(お)は初めてのイベントとなるためイベント発現人数/リスク集合で1/8
(お)の下は定義式に従うと
\(\frac{1}{7}×\frac{7}{8}+\frac{1}{8}=\frac{1}{4}\)
そのまま下へと進めていきます。
(う)は初めてイベント1が発生した時点となりますが、生存関数はイベント2を含めたものとなるため、この時点で3/4となっています。この時点でのリスク集合(い)は5ですので
\(\frac{1}{5}×\frac{3}{4}=\frac{3}{20}\)
となります。
同様の計算を繰り返して行くことで(え)(か)も得られます。
[5]
グラフは[4]の回答に従って描くのみで公式の回答がありますので割愛。
推定値の違いとして言えることは、競合リスクがあると累積イベント発現関数は通常のものと比べて低く出る可能性がある(逆に言えば競合リスクがない場合の通常の推定値が過大に推定されている)ということです。
つまり、今回の例では、心血管死に対する薬の効果のみをみるのであれば、競合リスクを考慮したモデルにしないとかえって心血管死の発生リスクが高くみえてしまいます。これはその他の死亡が除かれる分、総数が減り、イベント発生率が上がって見えてしまうためです。
かといって競合リスクがあまりに大きい場合(例えば超高齢者を対象にした試験)、そもそも薬を使っても他の原因でどんどん亡くなるのであれば、逆に過度にイベント発生率が低く見えてしまうため、これも注意が必要です。極端な話をすれば、試験開始直後に全員が他の原因で亡くなった場合、心血管死のイベント発生リスクは永遠に0になるわけですから。目的となる知りたい知識と前提となる条件次第でのモデル選択が大事ですね。
コメントを残す