2007年12月25日に開催された平成19年度第5回安全対策調査会の内容について、『薬のチェック』速報No99でその問題点を指摘した。
ところが、その後、このうちの1万人以上(18歳未満)を対象とした疫学調査の第1次予備解析データは、解析方法が完全に間違っていることが分かった。
当センターにおいて正しい方法で再計算した結果、示されたデータそのものが、タミフルにより異常行動が増加することを示していると判明したので、改めて問題点を指摘する。
問題の疫学調査は、横田班から受け継いだ大規模疫学調査(主任研究者:廣田良夫大阪市立大学大学院教授)(以下「廣田班」調査)の第1次予備解析結果報告のデータである。
この種の解析は、もともとタミフルが処方された全員をタミフル処方群とし、処方されなかった全員を非処方群として、異常言動もしくは重症異常行動の発症者の割合を比較する方法がもっとも一般的な方法である。
一旦、処方あるいは非処方が決定した後は、その後、処方群で服用したかどうかが明瞭でない例が存在する場合に、処方群全例を分母にして異常言動の発症割合を求め、非処方群と比較する。これは一種のITT解析の方法である。この場合、異常言動の発症がタミフル服用の前か後かは問題にしなくてよい。その理由は、タミフル服用前などにすでに異常言動を生じる例の扱いを廣田班の予備解析では問題にしているが(後述)、こうしたいわば、異常言動の早期発症例は、タミフル処方群にも、非処方群にも同様にありうるからである。また、両群にそれが入ると、オッズ比がやや減少し、影響が過少評価の方向に作用するが、決して影響を過大評価することにはならないため、それでも有意である場合は、よりいっそう意味がある。したがって必ずしも検定の際の障害にならない。また、絶対リスク減少(ARR)(この場合は絶対リスク増加)や、NNT(本件ではNNH)の計算には影響してこない。
この点に留意しながら、タミフル処方群と非処方群の異常言動発症割合を見よう。インフルエンザ患者の異常言動は、タミフル非処方群では11.9%(2192人中261人)、一方、タミフル処方群では15.6%(7677人中1196人)に発症した。非処方群に対するタミフル処方群の異常言動を起こす危険度(オッズ比)は、1.37倍、統計学的にその信頼性を示す95%信頼区間は1.18-1.58であった(信頼区間の下限が1を超えているので統計学的に有意、p=0.0000192:表1)。つまりタミフルが異常行動を増加させると結論して間違う確率は、5万分の1未満ということである。
タミフル処方 | タミフル処方なし | オッズ比 | P値 | |||||||
対象(n) | 異常行動 | % | 対象(n) | 異常行動 | % | オッズ比 | 95%信頼区間 | |||
全年齢 | 異常言動 | 7677 | 1196 | 15.6 | 2192 | 261 | 11.9 | 1.37 | 1.18-1.58 | 0.000019 |
重症異常行動 | 6906 | 40 | 0.58 | 2046 | 7 | 0.34 | 1.70 | 0.76-3.79 | 0.19 | |
10代 | 異常言動 | 2323 | 199 | 8.6 | 951 | 73 | 7.7 | 1.13 | 0.85-1.49 | 0.40 |
重症異常行動 | 2237 | 14 | 0.63 | 910 | 3 | 0.33 | 1.90 | 0.55-6.64 | 0.30 | |
10歳未満 | 異常言動 | 5354 | 997 | 18.6 | 1241 | 188 | 15.1 | 1.28 | 1.08-1.52 | 0.0041 |
重症異常行動 | 4669 | 26 | 0.56 | 1136 | 4 | 0.35 | 1.58 | 0.53-5.36 | 0.39 |
異常言動のNNH(Number Needed to Harm)は27である。NNH(異常言動)=27の意味は、
「27人がタミフルを服用すると1人がタミフルのために余分に異常言動を発症する」ということだ。(念のために付け加えると、この27人に1人という数は、他にバイアスがないことを前提にした場合、純粋にタミフルによって生じる異常言動の発症割合である)。
全年齢のデータと10代のデータから、10歳未満の異常言動の発症割合を計算することができる。タミフル非服用例では15.1%(1241人中188人)、一方、タミフル処方群では18.6%(5354人中997人)に発症した。非処方群に対するタミフル処方群の異常言動を起こす危険度(オッズ比)は、1.28(95%信頼区間1.08-1.52、p=0.0041:表1、10歳未満におけるNNHも29でほぼ同じであった)。
10歳未満で有意であったというこの事実は、タミフル使用禁止措置が、10歳代だけでなく、10歳未満にも必要であることを示す。
この調査では、処方群のうち、非服用者の数を正確に知ることができない。それは、タミフルの服用の有無を時間軸に書き込む以外にチェックする項目はないからである(異常言動の発症の有無は、時間軸にチェックを入れる以外に別項目を設けているので、どちらかに記載があれば異常言動があったとすることができる)。
異常言動については、大部分で時間軸にも記入があったことから、時間軸にタミフルの服用が記載されていない場合には、その多くが服用しなかったと考えられる(一部服用したのに記入もれもありうるが、それを考慮すると、ますますタミフル服用群での異常言動発症率は多くなる)。
したがって、服用チェックのあった例だけを用いて、服用群における異常言動の発症割合の推定近似値とすることが可能である(しかも、やや過少評価である)。
タミフル処方群における非服用群の異常言動発症割合近似値は7.0%(568人中40人)であるが、タミフル服用確実例では、16.3%(7109人中1156人)であった。オッズ比2.56(1.83-3.61、p<0.0000001)であった(服用チェックのなかった中には、服用したのに記入もれもありうるが、それを考慮すると、ますますタミフル服用群での異常言動発症割合は多くなり、非服用群の発症割合が低下する)。
なお、タミフル処方群における非服用群の異常言動発症割合を10歳未満について求めると、非服用群8.9%、服用群19.4%、オッズ比2.48(95%信頼区間1.68-3.68、p=0.000001)であった。
タミフル処方群の非服用例(服用チェックなし)とタミフル非処方群をあわせてタミフル非服用総数群とすると、その異常言動発症割合は、10.9%(2760人中301人)であり、オッズ比は1.59(95%信頼区間1.68-1.82、p<0.0000001)となる。10歳未満はオッズ比1.54(95%信頼区間1.31-1.82、p=0.0000001)であった。
なお、タミフルの使用前に異常言動があった例(早期異常言動発症例)や、使用と異常言動の発症の前後関係が不明な例をタミフル使用群から除き、非使用群からも早期異常言動発症例に相当する数を除いて両群を比較すると、より関連が強くなる(オッズ比1.63、95%信頼区間1.35-1.98、p=0.0000003、だだし、オッズ比は大きくなるが、絶対リスク増加、NNHは基本的には変化しない)。
しかも、速報No99で指摘したように、タミフルとの関連を少なくする方に働く(バイアス=偏りを生じさせる)要因は多い。それにもかかわらず、10歳未満にも、小児全体としても、このように有意に高いオッズ比が得られたということである。
重症の異常行動に限ると、全年齢では、割合の差は統計学的には有意ではないが、異常行動全体よりむしろオッズ比1.69と、高い傾向にあった(表1)。
10代では、異常言動全体でも重症異常行動も差は有意でなかったが、重症異常行動オッズ比は1.90と高い傾向にあった(表1)。
一方、10代で重症異常行動は、非服用群が0.33%(910人中3人)に対して、タミフル服用群では0.63%(2237人中14人)であり、統計学的には有意の差はないものの、オッズ比は1.90であった(表1)。
この場合も統計学的には有意な関連とはいえないが、タミフル処方群で異常行動の報告がなされにくくなる可能性を考慮すると、本来のオッズ比はより高い可能性がある。
なお、タミフル服用前など早期異常言動発症例を両群から除くと、オッズ比は、全年齢の重症異常行動では2.0(0.66-6.2)、10代で異常言動全体では、1.2(0.87-1.7)、10代の重症異常行動は、2.4(0.4-13.68)と計算でき、統計学的には有意でないものの、いずれも、早期発症例を含めたよりも違いが大きくなった。
またこれらのデータは、全年齢の異常言動の有意な発症増大と、同じ傾向にあり、異質性の全くないデータである。単に発症数が小さいために統計学的に有意にならないだけであり、関連がありうると考えておくべきデータである。
全経過を通じても、タミフルを服用しない場合に比較してタミフル服用での異常行動が1.4倍であったということは、初日だけについて異常行動の出現割合を比較すれば、おそらくその差はもっと大きくなるであろう。また、初日の昼間、あるいは初回服用から数時間に限ってみれば、さらにその違いが明瞭になると考えられる。
この関係は、ちょうど、嘔吐に関するランダム化比較試験の結果の解析の初日と全体との関係、また、横田班の調査における初日午後と全体との違いと似ている。
嘔吐に関するランダム化比較試験の結果というのは、小児のインフルエンザの治療の臨床試験結果のことである。プラセボ(偽薬)群とタミフル服用群で、嘔吐をした子の割合を比較した場合、全経過ではオッズ比(嘔吐しやすさの倍率)が1.7(倍)であったが、初日だけをみると3.4(倍)であった(表2)。
症状 | プラセボ(n=517) | タミフル(n=515) | オッズ比 | NNH | ||
数 | % | 数 | % | (95%信頼区間) | ||
嘔吐(1日目) | 16 | 3.1 | 51 | 9.9 | 3.4 (1.9-6.1) | 15 |
嘔吐(2日目以降) | 32 | 6.2 | 26 | 5 | 0.8 (0.47-1.4) | |
嘔吐(全体) | 48 | 9.3 | 77 | 15 | 1.7 (1.2-2.5) | 18 |
新薬承認情報集(製品概要:NAP)のデータから、医薬ビジランス研究所で解析。 |
---|
では廣田班の予備解析ではどのような方法を使って、服用群が非服用群の半分になったというような結果を導き出したのであろうか。
その最大のカラクリは、誤分類である。処方群から異常言動例を抜いて、非処方群に入れ込んだのである。概略を説明すると次のようなものである。
タミフル処方群の異常言動を起こした子の1部(285人)を処方群の分子(1196人)からも分母(7677人)からも抜き、非処方群の分子(261人)と分母(2192人)に加えていたのである。この操作によって、タミフル処方群の異常言動発症の4分の1が減じられ、非処方群の異常言動発症者は倍増させている。
本来のオッズ比1.37は逆転し、オッズ比0.38(非服用群22%、服用群9.7%)などというとんでもない値になった理由の大部分が、このようなマジックともいうべき操作によることで説明がつく。
受診前やタミフル服用前など、インフルエンザの早期に発症する例がありうることは確かである(早期発症例)。しかし、注意が必要なのは、そうした受診前などにも発症する早期発症例は、タミフル非処方例の中にもあるはずだ。
タミフル非処方群の異常言動発症例は、タミフル服用という行為はないから、その前後の区別はなく、早期発症例も、遅くに発症する異常言動も区別なく含まれている。したがって、非処方群のそうした状態と同じ条件のタミフル処方群の異常言動発症者を選ぶなら、タミフル服用前の異常言動発症者も入れて比較しなければ適切な比較にならない。割合の倍率は縮まるが、タミフルの影響を過小評価するだけで、過大評価することにはならない。
どうしてもタミフル服用前の早期発症例をタミフル処方群から除きたいなら、タミフル非処方群からも早期発症例を除かなければならないのだが、そうした手続きをとっていないのである。操作は単に早期発症例を除外するだけでなく、タミフル処方群から除いた異常言動早期発症例を、非処方群の分母と分子に足してしまっている。しかも、タミフル非処方群の人数は処方群の3分の1あまりしかないので、非処方群の異常言動発症例の割合は一気に増えることになる。
もう一つの大きな操作は、処方群の非服用者の扱いである。異常言動の発症の有無は、時間軸にチェックを入れる項目が別にあるが、タミフルの服用の有無を時間軸書き込む以外にチェックする項目はない。したがって、時間軸にタミフルの服用が記載されていない場合は、その多くが服用しなかったと考えられる(一部服用したのに記入もれもありうるが、それを考慮すると、ますますタミフル服用群での異常言動発症率は多くなる)。ところが、服用チェックがされていなかった子のうち、異常言動を発症しなかった場合は処方群の分母に算入し、異常言動を発症した例は、分子にも分母にも算入していない。だから処方群の分母だけが増えることになった。こうして、処方群の分母は大きいまま分子だけが小さくなるために、処方群の異常言動発症割合が実際より著しく低下する。
このように、もともと処方群の分子を抜いて(タミフル非処方群でない)それらの子を、タミフル非処方群に入れ、処方されても服用しなかった子を処方群の分母に加えるという、疫学調査では基本的にしてはいけない誤分類をするというまちがった解析をしている。
疫学の専門家である廣田教授が、このような疫学の基本的間違いをするはずがないが、もしそれを間違いでないというなら、学問とは何か別に力が働いたとしか言いようがない。
厚労省は、25日の調査会に先立ち、数日前にマスメディアに対して、廣田班の一次予備解析結果を「タミフル使用者の頻度が非使用に較べて有意に低い」と、さも確定的な結果であるかのように発表した。これを受けて、25日夕方5時〜7時開催の調査会に合わせてマスメディア各社は報道内容を用意した。その結果、NHKを筆頭に、「タミフル服用群の方が非服用群よりも、異常行動の割合が低かった」との趣旨で各社が報道した。
厚労省担当官は、事前の記者会見で、有意に低くなる理由として、「早く解熱するからタミフル群に異常行動が少なくなる」ということまであげていたという。
廣田班長は、25日の第5回調査会において、「この結果を最終報告ととらないように」と、繰り返し発言していたのだが(速報No99参照)、このギャップはどう説明できるのだろうか。
本来、この調査は、タミフルと異常言動(異常行動)との因果関係を深め、10代だけでなく、10歳未満についても使用禁止の措置をとるべき根拠となるはずであった。
ところが、厚生労働省が、この調査が本来持っている意味とは全く逆の結果を公表し、マスメディア各社が流した。タミフルとの因果関係を深めるどころか、逆に、因果関係に否定的な印象を国民に与えてしまったのである。逆の結果を示すデータに基づいて、本来禁止措置を広げるべき判断をがしない方向に誘導する役割をしたのである。
1次予備解析とはいえ、本来10歳未満にも禁止措置を広げる根拠となる重要なデータである。研究班(廣田班)として、速やかに訂正をするべきである。
また、調査会において改めて訂正データに基づきその意味を吟味し、10歳未満も「使用禁止」とすべきである。
成人も突然死の危険は大きい。成人にも禁止措置が必要だ。