変量効果モデルによるメタアナリシスの予測区間

概要

メタアナリシスは過去に行われた臨床試験の結果を統合し、関心のある薬剤・治療法の治療効果や副作用の大きさを評価するための研究手法である。 $K$個の互いに独立な確率変数$Y_k$ ($k=1, 2, \ldots, K$)を治療効果の推定値とすると、変量効果モデルは、 \[ \begin{array}{lll} Y_k &=& \theta_k+\epsilon_k,\\ \theta_k &=& \mu+u_k, \end{array} \] で定義される。 ただし、$\theta_k$は真の治療効果、$\mu$は平均治療効果パラメータ、$\epsilon_k \sim N(0, \sigma_k^2)$は試験内の誤差確率変数、および$u_k \sim N(0, \tau^2)$は各試験の平均治療効果からの違いを表す試験間変動の確率変数とする。

Higgins et al. (2009)は、変量効果モデルを用いたメタアナリシス (以下、変量効果メタアナリシス) において、新たな試験を行ったときに期待される治療効果がどの程度になりうるかを統合結果をもとに推測するために、予測区間を用いることを提案した。 また、Riley et al. (2011)では、変量効果メタアナリシスの結果の要約として、平均治療効果の信頼区間や異質性の評価指標($I^2$など)とともに予測区間を示すことを強く推奨している。 これは、Riley et al. (2010)において、変量効果メタアナリシスを実施した44のコクランレビューを調査した結果、平均治療効果の信頼区間を正しく解釈していたものは一つもなく、固定効果モデルを用いた際の共通治療効果と同様の解釈が行われていたことが理由である。 平均治療効果と異質性の評価指標を別々に提示すると、正しい解釈がなされない現状を是正するために、予測区間を示すべきであるという主張は合理的であると考えられる。 また、予測区間を用いることで、変量効果メタアナリシスの結果を別の集団に適用した際に期待される治療効果の範囲などを見積もることができるため、臨床上有用な要約指標であると考えられる。

予測区間の構成方法はいくつか提案されており、Higginsらの予測区間(Higgins et al., 2009) \[ \left[ \hat{\mu}-t_{K-2}^{\alpha}\sqrt{\hat{\tau}_{DL}^2+\widehat{\mathrm{SE}}[\hat{\mu}]^2},~ \hat{\mu}+t_{K-2}^{\alpha}\sqrt{\hat{\tau}_{DL}^2+\widehat{\mathrm{SE}}[\hat{\mu}]^2} \right], \] と、異質性パラメータ($\tau^2$)のDerSimonian–Laird推定量$\hat{\tau}_{DL}^2$をREML推定量に置き換えた予測区間(Partlett and Riley, 2017)がある。 ただし、$\hat{\mu}=\sum_{k=1}^K \hat{w}_k Y_k/\sum_{k=1}^K \hat{w}_k$,$\hat{w}_k=(\sigma_k^2+\hat{\tau}_{DL}^2)^{-1}$,$\hat{\tau}_{DL}^2=\max[0, \hat{\tau}_{UDL}^2]$,$\hat{\tau}_{UDL}^2=\{Q-(K-1)\}/(S_1+S_2/S_1)$,$Q=\sum_{k=1}^K v_k(Y_k-\bar{Y})^2 \sim F_Q(\tau^2)$, $v_k=\sigma_k^{-2}$, $\bar{Y}=\sum_{k=1}^K v_k Y_k/\sum_{k=1}^K v_k$,$S_r=\sum_{k=1}^K v_k^r$($r=1, 2$),$\widehat{\mathrm{SE}}[\hat{\mu}]^2=(\sum_{k=1}^K \hat{w}_k)^{-1}$,$t_{K-2}^{\alpha}$は自由度$K-2$の$t$分布の$100(1-\alpha/2)\%$点である。 これらの予測区間は特に統合する試験数($K$)や異質性パラメータの値($\tau^2$)が小さい場合に、被覆確率が過小となることがシミュレーションにより示されている。 Kontopantelis et al. (2013)の調査によると、今までに公開された変量効果メタアナリシスの9割程度は統合する試験数が20未満であり、既存の予測区間を適用するとうまくゆかないケースが多く存在すると考えられる。

Nagashima et al. (2018)は、既存法では予測区間を構成するために$(\hat{\mu}-\mu)/\sqrt{\widehat{\mathrm{SE}}[\hat{\mu}]}$が漸近的に$N(0, 1)$に従う事および$(K-2)(\hat{\tau}_{DL}^2+\widehat{\mathrm{SE}}[\hat{\mu}]^2)/(\tau^2+\mathrm{SE}[\hat{\mu}]^2)$の分布が$\chi^2(K-2)$で近似できる事に基づいて予測区間を構成しており、それを小標本下にそのまま適用したために被覆確率が過小となっている事を示した。そして、特に後者が被覆確率の低下に大きな影響を及ぼしている事を明らかにした。 これらを考慮して、前者は$(\hat{\mu}-\mu)/\widehat{\mathrm{SE}}_H[\hat{\mu}]$の分布が$t(K-1)$で近似できることを利用した推測に置き換え(小標本下でも良い近似を与える)、後者は近似を用いずにconfidence distribution (Xie and Singh, 2013)に基づく$\hat{\tau}_{UDL}^2$の正確な分布からのパラメトリックブートストラップ標本を用いた推測に置き換えることで、予測区間の被覆確率が名義の値に非常に近くなる方法を提案した。 ただし、$\widehat{\mathrm{SE}}_H[\hat{\mu}]^2=\frac{1}{K-1}\sum_{k=1}^K \frac{\hat{w}_k}{\sum_{l=1}^K \hat{w}_l}(Y_k-\hat{\mu})^2$である。 また、$\hat{\tau}_{UDL}^2$の正確な分布が$Q$の正確な分布に基づいて構成できることを示した。 提案法は、$\theta_{new}$の分布を統計量$\hat{\mu}+Z \hat{\tau}_{UDL}-t_{K-1}\widehat{\mathrm{SE}}_H(\hat{\mu})$を用いて推定する方法となっている。 ここで、$Z \sim N(0,1)$,$t_{K-1} \sim t(K-1)$, $\hat{\tau}_{UDL} \sim H_{\tau^2}(q_{obs})$は確率変数でありパラメトリックブートストラップ法で分布を構成する、$\hat{\mu}$と$\widehat{\mathrm{SE}}_H(\hat{\mu})$は推定値をプラグインしたものである(導出や詳細は論文参照)。 論文では、シミュレーションによって、特に既存法の被覆確率が過小となる条件下(現実的なメタアナリシスでも充分起こっていると考えられる)で提案法がほぼ名義の被覆確率を達成することを示した。

最後に、これは個人的な意見になるが、異質性パラメータの検定結果が統計的に有意でないケースや異質性パラメータが$0$として推定される場合であっても、固定効果モデルの結果だけではなく、変量効果モデルの結果も示すべきだと考えている。 この理由は、統合する試験数が小さくかつ異質性パラメータの真値($\tau^2$)が小さいか中程度の場合、多くのケースで推定値($\hat{\tau}^2$)がtruncateされて$0$となる現象が観察されるためである。 異質性のパラメータ推定値は推定誤差があり、これを無視してtruncateした点推定値をそのまま真値として代入する(固定効果モデルを用いることに相当する)ことによる影響は非常に大きいことがわかっている。 特に統合する試験数が小さい場合は推定誤差が非常に大きいため、異質性パラメータを$0$としてしまっているケースは無視できない割合で存在するのではないかと考えている。

解説資料

R pimeta package

参考文献

  1. Higgins JPT, Thompson SG, Spiegelhalter DJ. A re-evaluation of random-effects meta-analysis. Journal of the Royal Statistical Society: Series A (Statistics in Society) 2009; 172(1): 137–159. DOI: 10.1111/j.1467-985X.2008.00552.x.
  2. Partlett C, Riley RD. Random effects meta-analysis: Coverage performance of 95% confidence and prediction intervals following REML estimation. Statistics in Medicine 2017; 36(2): 301–317. DOI: 10.1002/sim.7140.
  3. Xie M, Singh K. Confidence distribution, the frequentist distribution estimator of a parameter: a review. International Statistical Review 2013; 81: 3–39. DOI: 10.1111/insr.12000.
  4. Nagashima K, Noma H, Furukawa TA. Prediction intervals for random-effects meta-analysis: a confidence distribution approach. Statistical Methods in Medical Research 2019; 28(6): 1689–1702. DOI: 10.1177/0962280218773520. [arXiv:1804.01054]
  5. Riley RD, Gates SG, Neilson J, Alfirevic Z. Statistical methods can be improved within Cochrane pregnancy and childbirth reviews. Journal of Clinical Epidemiology 2010; 64(6): 608–618. DOI: 10.1016/j.jclinepi.2010.08.002
  6. Riley RD, Higgins JPT, Deeks JJ. Interpretation of random effects meta-analyses. BMJ 2011; 342: d549. DOI: 10.1136/bmj.d549.
  7. Kontopantelis E, Springate DA, Reeves D. A re-analysis of the Cochrane library data: the dangers of unobserved heterogeneity in meta-analyses. PLoS One 2013; 8: e69930. DOI: 10.1371/journal.pone.0069930

履歴

  • 2018/09/14 統計関連学会連合大会の発表資料の情報を追記
  • 2018/06/12 公開