AとBとで生存率に統計的有意差が無かった(または有った)。
薬aの効果(生存率と投与量の因果関係)の有無を示すことができるか?
効果が有るようにみえて、実は病院Aは体力のある若い患者が多く、病院Bは体力のない老人が多かったかもしれない。
逆に、効果が無いようにみえて、病院Aは体力のない老人が多かったかもしれない。
つまり、病院と患者の生存率に交絡がある可能性がある。従って、これだけで薬の効果を判断することは出来ない。
実験対象患者数が増えるので各グループから推定される生存率とその分布、つまり推定生存率の信頼区間は小さくなり、精度がよくなるだろう。もしかしたら見えなかった有意差が見えてくるかもしれない。
しかし、交絡を排除できるわけではないので、年齢構成など他の要因が効果の主要因であるという懸念を拭えない。
片瀬久美子女史@kumikokataseは、
https://twitter.com/kumikokatase/status/258842868968476672
https://twitter.com/kumikokatase/status/258892540995067904
で、
EMを使用している農地と、対照としてEMを使用していない農地について、それぞれ複数箇所を測定して、データのバラツキ具合なども考慮して統計的な比較をすれば、どの程度差があるか(ないか)を指摘することはできると思います。としている。
複数箇所を測定していく=患者数を増やせば、それぞれのグループの推定値はより正しくなっていく(個々のデータからくるバラツキは小さくなる)。しかし、グループ間の交絡による影響が排除されるわけではない。
各測定には隣接した農地という重大な共通点があり、例えば雨水からの流出入量、元々の地質の違い、耕作者の掘り起こし深さの違い、近辺の農家の施肥の違いなど、それぞれの測定で共通する交絡因子が容易に予想できる。
統計を使う記事を書くサイエンスライターが、交絡を無視するというのは問題がある。
持論の必要に応じて、意図的に無視しているのか、気付いていないだけなのかは文章からはよくわからない。
https://twitter.com/kikumaco/status/258838747439841281
ラベル:統計