論文にまとめるための統計解析②―統計モデルの適用

最終回となる今回は実際にデータを収集し、分析を行う際に必要になる統計モデルについて紹介します。

新規の治療法と従来の治療法による効果を比較したい場合、最も優れた研究デザインは無作為化比較試験ですが、その前段階として、過去に蓄積されたデータベースを用いて、観察研究として検討することもあります。

その際に気を付けなければならないのが、「交絡因子」です(図1)。新規および従来の治療法とアウトカム(生存率など)の両方に影響を与える因子のことです。

例えば、治療法を決定する際に、高齢で、重症度が高く、合併症がある患者には新規治療法でなく、従来の治療法を行うことが多い、というような治療法の選択に影響を与え、かつ、アウトカムにも影響を与えるような因子のことを「交絡因子」といいます。

この交絡因子の影響を除去できるのが無作為化比較試験ですが、観察研究で、治療法を比較する場合は交絡因子の制御が重要となります。

交絡の制御方法としては以下の3つが挙げられます。
①【層別化】年齢階級別、重症度別、合併症の有無別にアウトカムを比較する
②【標準化】新規治療群と従来治療群における交絡因子の分布をそろえて、比較する
③【多変量解析】Cox比例ハザードモデルなどの統計モデルにより、各要因の影響度をそれぞれ補正したうえで、治療の違いにおける効果を比較する

①、②はあまりたくさんの要因については考慮が難しくなります。

③と②を組み合わせたような方法として、最近よく使用されているのが「傾向スコア」です。どちらの治療法が実施されたかどうかを目的変数(新規治療=1、従来治療=0)とし、関連するすべての変数を説明変数として組み込んだロジスティック回帰モデルにより、新規治療群となりやすさ(傾向スコア)を推定する式を作ります。

それにより、患者さん一人ひとりに、新規治療群のなりやすさの程度が割り振られます(図2)。

例えば、この図の例の場合のように傾向スコアは非治療群の方がやや小さい値になる可能性があります。つまり、このまま背景因子の異なる分布を比較するのではなく、点線で囲まれた部分になるように、マッチングや逆確率による重み付けをして、比較をすることで、治療群の決定に影響を与える要因の分布をそろえて、結果の比較をできるという方法です。

観察研究を疑似的に無作為化比較試験に近づけるような統計的な手法として登場し、近年、データベース研究などのでよく使用されています。適用の詳細については参考文献をご参照ください。


ページ上部へ戻る