无论是课本里的描述,还是老师上课讲的内容,都无法让我理解「置信区间」。于是我查资料,勉勉强强梳理了这个概念。
课本上举的例子就像是在说「总体均数有可能在置信区间里,也有可能不在」。但是我们都知道,总体均数是一个客观存在的数据,并不随取样的变化而变化。那为什么会「有概率」在某个区间内呢?难道不是仅仅有「在」和「不在」两个结果吗?之前的我根本想不通这一点。
这其实是因为,「置信区间」并不是通过一两次的抽样决定的。换句话说,所谓「置信区间」指的其实是这一个东西:
我们进行了一次采样,而这个样本的均数为。而根据公式,95%置信区间的半径为。因此我们可以构造区间。
借助这个样本,我们估计95%置信区间为。这个置信区间是用样本估计出来的,并不直接来源于总体数据。
我们进行了第二次采样,样本的均数为。借助第二个样本,构造出来的95%置信区间为。因为每次采样得到的数据不一样,所以构造出来的置信区间也不一样。
我们还是不能确定真实的μ,所以又进行了98次采样,一共采样了100次。第N次采样的置信区间为。
现在我们获得了100个区间。在理想状态下,正好有95个区间里包含了总体均数。这就是课本上所谓的「总体均数被包含在某个区间里的概率为95%」。
一般而言,我们并不会进行太多次采样。因此我们通过一次采样得到的一个区间,便被称为「置信区间」了。
当然,这么说并不直观。建议阅读文末的参考文章,这对于理解更有帮助。