这个问题在前面的一篇推文中讨论过,今天再单独讨论一下。
首先我们来看一下统计书上对α的解释:
姜晶梅《医学统计学基础》:
1.检验水准是指假设检验作推断结论时我们提前设定允许发生第Ⅰ类错误的概率,记为α,其取值大小依据小概率事件的准则来确定,实际中常取0.05,0.01,0.10
2.犯第Ⅰ类错误的概率用符号α表示
3.要使概率α和β同时减小的办法只能是增大样本量
第一次看完这几句话产生了几个疑问:既然α是事先取好的(比如取0.05),那么按照第二句话,犯第Ⅰ类错误的概率应该就是0.05,那么第三句话,既然α已经确定是0.05了,增大样本量又怎么能让α减小呢?
思考了一下,觉得可以这样理解:在同样的样本量下,α越大,β越小,α越小,β越大。假设我的α=0.05,β=0.1,那么我α取0.01的时候,β可能就增加到了0.2。那么如果想要在α=0.01时,得到一个小一点的β(比如0.1),就可以通过增大样本量来实现。
再看一下其他书对它的解释:
李晓松《卫生统计学(第八版)》:
α是人为规定的,表示拒绝实际上成立的H0的最大允许概率,通常取0.05,表示如果真实情况是H0成立,我们根据样本信息错误拒绝H0的概率不超过5%。
α就是犯第Ⅰ类错误的概率,是当H0为真时,假设检验拒绝H0的概率。
仔细看这两句话,其实是矛盾的。第一句话说明α是犯第Ⅰ类错误的最大允许概率,但第二句话又说α就是犯第Ⅰ类错误的概率。我们来接着看:
刘桂芬《医学统计学(第二版)》:
1.α称为检验水准,是预先认为确定的概率,表示拒绝实际上成立的H0时,推断错误的最大允许概率。
2.α是预先规定的允许犯第Ⅰ类错误概率的最大值。
3.若要同时减小第Ⅰ类错误α和第Ⅱ类错误β,唯一的方法是增大样本量
这个解释就把α定义为犯Ⅰ类错误的最大值,第三句话的解释同第一个例子的解释。继续:
颜虹《医学统计学(第二版)》:
1.α是预先规定的判断小概率事件的概率尺度,由于统计学历史发展的早期阶段不能提供详细的概率分布表,α通常定为0.05或0.01,一直沿用至今。
2.犯第Ⅰ类错误的概率记作α,是在研究设计时根据不同研究目的的预先规定的允许犯第Ⅰ类错误概率的最大值。
3.若要同时减小α和β就必须通过增大样本含量n来减小均数的标准误。
第一句话可以解释为,α是事先规定的,由于过去计算机软件不发达,较难给出假设检验的精确p值,因此说犯第Ⅰ类错误的概率就是α,实际上这很可能是不严谨的,只不过是没有能力算出精确的p值,所以就给出了一个不精确但不影响整个统计推断的值(比如0.05)。但是当今的各种统计软件如SPSS,SAS等都是可以精确计算出p值的(比如p=0.),第三句话,以t检验为例,下面是公式,增大样本量n可以减小均数的标准误,从而使t值增大,一般在样本量很大的时候接近正态分布,t1.96即可得到p0.05,此时样本量越大,t与1.96的差值越大,p值同时就会越小。那么这个时候,增大样本量所减小的并不是α,而是p。最后再看一本书的说法:
Anderson《商务与经济统计(第八版)》:
1.α是第Ⅰ类错误的概率的最大允许值,称为检验的显著性水平
2.p值称为观察的显著性水平
这个解释说明,α是人为规定的一个标准,犯第Ⅰ类错误的概率不能超过它。假设α=0.05,我算出来p=0.1,那么我犯第Ⅰ类错误的概率就是0.1,超出了我规定的最大允许值0.05,因此不拒绝原假设;相反,若算出来的p=0.01,那么我犯第Ⅰ类错误的概率是0.01,没有超过我规定的界值0.05,因此拒绝原假设。因此根据上述的观点,我们可以总结出i.检验水准α是犯第Ⅰ类错误的最大概率,称为检验的显著性水平;ii.犯第Ⅰ类错误的真实值是p值,称为观察的显著性水平个人认为,有些统计书上的表达并不是十分严谨,对上述内容还有疑问的朋友建议咨询一下专业的统计专家和老师。推荐阅读:
小白学统计——再谈两类错误
样本方差的分母为什么是n-1?
小白学统计——前言
小白学统计——1.绪论
小白学统计——2.统计描述:频数分布
小白学统计——科学计算器:统计描述
小白学统计——科学计算器:线性相关与回归
小白学统计——统计思维:定量/分类资料的组间比较
小白学统计——基本统计概念及方法小结
长按