怎么理解置信区间？

无论是课本里的描述，还是老师上课讲的内容，都无法让我理解「置信区间」。于是我查资料，勉勉强强梳理了这个概念。

课本上举的例子就像是在说「总体均数有可能在置信区间里，也有可能不在」。但是我们都知道，总体均数是一个客观存在的数据，并不随取样的变化而变化。那为什么会「有概率」在某个区间内呢？难道不是仅仅有「在」和「不在」两个结果吗？之前的我根本想不通这一点。

这其实是因为，「置信区间」并不是通过一两次的抽样决定的。换句话说，所谓「置信区间」指的其实是这一个东西：

我们进行了一次采样，而这个样本的均数为 $\bar{X_1}$ 。而根据公式，95%置信区间的半径为 $1.96\frac{\sigma}{\sqrt{n}}$ 。因此我们可以构造区间。

借助这个样本，我们估计95%置信区间为 $(\bar{X_1}-1.96\frac{\sigma}{\sqrt{n}},\bar{X_1}+1.96\frac{\sigma}{\sqrt{n}})$ 。这个置信区间是用样本估计出来的，并不直接来源于总体数据。

我们进行了第二次采样，样本的均数为 $\bar{X_2}$ 。借助第二个样本，构造出来的95%置信区间为 $(\bar{X_2}-1.96\frac{\sigma}{\sqrt{n}},\bar{X_2}+1.96\frac{\sigma}{\sqrt{n}})$ 。因为每次采样得到的数据不一样，所以构造出来的置信区间也不一样。

我们还是不能确定真实的μ，所以又进行了98次采样，一共采样了100次。第N次采样的置信区间为 $(\bar{X_N}-1.96\frac{\sigma}{\sqrt{n}},\bar{X_N}+1.96\frac{\sigma}{\sqrt{n}})$ 。

现在我们获得了100个区间。在理想状态下，正好有95个区间里包含了总体均数 $\mu$ 。这就是课本上所谓的「总体均数被包含在某个区间里的概率为95%」。

一般而言，我们并不会进行太多次采样。因此我们通过一次采样得到的一个区间，便被称为「置信区间」了。

当然，这么说并不直观。建议阅读文末的参考文章，这对于理解更有帮助。

如何理解 95% 置信区间？ - 马同学的回答 - 知乎

本文采用署名-非商业性使用-相同方式共享 4.0 国际许可协议，转载请注明出处。