独立样本t检验的统计效能和样本量的计算 独立样本t检验统计量计算公式


独立样本t检验的统计效能和样本量的计算 独立样本t检验统计量计算公式

文章插图
今天给大家写写如何用R软件计算t检验中统计效能和样本量 。
实例描述现在有一个公司声称他们的灯泡一般能用850±50个小时 , 但是我买了一个发现用了700个小时就坏了 , 那我就怀疑了 , 商家虚假宣传 , 那么我该如何证明呢?或者说 , 我要测试多少个灯泡能证明商家撒谎?
在这个例子中我们的目的就是要弄明白我们到底需要测试多少个灯泡 , 似乎就是一个算样本量的问题 , 在一个我们提前设定的显著性水平和想要的统计效能下算出这个样本量
这么样思考好像挺难的 , 我们不妨先反过来想:
商家不是说他的灯泡能用850±50个小时嘛 , 而我坚信商家在撒谎 , 我认为商家多说了比如说40个小时 , 那么此时我们就有
  • H0:灯泡能用850小时 , 
  • H1:灯泡能用810小时 , 
这时我们会进行一个统计检验 , 显著性水平大多数情况会设定在0.05 , 意思是一类错误的概率是0.05 , 就是说当H0为真的时候我们只有0.05的可能性拒绝它 , 就是说我们这个统计检验做出来灯泡确实用不到850小时 , 95%的情况下我们都是可靠的 , 这个叫做significance level;
那么要做这个检验我们还要规定一个东西叫做统计效能power , 通常设置为0.9 , 就是说我希望我做这个统计 , 如果灯泡真的用不到850小时 , 90%的情况下我能够拒绝H0
以上两点 , 我们首先确定检验的可靠性 , 再次确定这个检验值得做确实有效力 , 想的都挺美 , 只要我做了检验 , 如果灯泡真的用不到850小时 , 90%的情况下我都能够拒绝H0得到阳性结果 , 而且呀 , 我得到阳性结果 , 假阳性的概率只有0.05 。
别急 , 标准差在整个过程中也有重要影响 , 我们想象一个极端的例子 , 比如如果灯泡使用寿命没有变异 , 就是商家说能用850小时 , 那么每个灯泡都应该能用850小时 , 此时 , 只要一个灯泡就能解决我们的怀疑 , 但是现实总是不确定的 , 有的能1000小时 , 有的能用500小时 , 我们只能多取点样本以期覆盖更多的变异 , 所以变异常常也会影响我们做统计时的样本量 , 这就扯出来了我们要讨论的另一个东西 , 叫做效应量下一部分会写它如何来的) 。
实际上 ,  , 以及效应量这四个指标 , 知道了任意三个 , 就可以推导出最后一个 。通常 , 是已知的(由研究者确定 , 一般为0.05) 。
用R语言计算统计效能在R语言中 , 对于均值检验的统计功效和样本量计算是非常容易的 , 我们只用规定另外3个值就行 , 比如我要计算效应量d为(850-810)/50 , 统计功效为0.9 , 显著性水平是0.05时的样本量 , 写如下代码就可以:
library(pwr)pwr.t.test(d=(850-810)/50,power=0.9,sig.level=0.05,type="one.sample",alternative="two.sided")
结果就很明确了 , 我们只需要测试19个灯泡就可以在90%的情况下拒绝H0(如果灯泡真的用不到850小时的话) 。
上面是从确定统计效能为0.9 , 显著性水平为0.05时求样本量 。


以上关于本文的内容,仅作参考!温馨提示:如遇健康、疾病相关的问题,请您及时就医或请专业人士给予相关指导!

「四川龙网」www.sichuanlong.com小编还为您精选了以下内容,希望对您有所帮助: