无论是课本里的描述,还是老师上课讲的内容,都无法让我理解「置信区间」。于是我查资料,勉勉强强梳理了这个概念。

课本上举的例子就像是在说「总体均数有可能在置信区间里,也有可能不在」。但是我们都知道,总体均数是一个客观存在的数据,并不随取样的变化而变化。那为什么会「有概率」在某个区间内呢?难道不是仅仅有「在」和「不在」两个结果吗?之前的我根本想不通这一点。

这其实是因为,「置信区间」并不是通过一两次的抽样决定的。换句话说,所谓「置信区间」指的其实是这一个东西:

我们进行了一次采样,而这个样本的均数为X1ˉ\bar{X_1}。而根据公式,95%置信区间的半径为1.96σn1.96\frac{\sigma}{\sqrt{n}}。因此我们可以构造区间。

借助这个样本,我们估计95%置信区间为(X1ˉ1.96σn,X1ˉ+1.96σn)(\bar{X_1}-1.96\frac{\sigma}{\sqrt{n}},\bar{X_1}+1.96\frac{\sigma}{\sqrt{n}})。这个置信区间是用样本估计出来的,并不直接来源于总体数据。

我们进行了第二次采样,样本的均数为X2ˉ\bar{X_2}。借助第二个样本,构造出来的95%置信区间为(X2ˉ1.96σn,X2ˉ+1.96σn)(\bar{X_2}-1.96\frac{\sigma}{\sqrt{n}},\bar{X_2}+1.96\frac{\sigma}{\sqrt{n}})。因为每次采样得到的数据不一样,所以构造出来的置信区间也不一样。

我们还是不能确定真实的μ,所以又进行了98次采样,一共采样了100次。第N次采样的置信区间为(XNˉ1.96σn,XNˉ+1.96σn)(\bar{X_N}-1.96\frac{\sigma}{\sqrt{n}},\bar{X_N}+1.96\frac{\sigma}{\sqrt{n}})

现在我们获得了100个区间。在理想状态下,正好有95个区间里包含了总体均数μ\mu。这就是课本上所谓的「总体均数被包含在某个区间里的概率为95%」。

一般而言,我们并不会进行太多次采样。因此我们通过一次采样得到的一个区间,便被称为「置信区间」了。

当然,这么说并不直观。建议阅读文末的参考文章,这对于理解更有帮助。