单样本t检验

单样本t检验」适用于来自「正态分布」的某个样本均数$\bar{X}$与已知总体均数$\mu _0$的比较。

比较目的:检验样本均数$\bar X$所代表的总体均数$\mu$是否与已知总体均数$\mu _0$有差别。

单样本t检验用于总体标准差$\sigma$未知的资料,其统计量t值计算公式为:

$$
t = \frac{\bar X - \mu_0}{S_{\bar X}} = \frac{\bar X - \mu _0}{S/\sqrt{n}}, v= n - 1
$$

参数说明:

  • $S$:样本标准差
  • $n$:样本含量
例7-1

以往通过大规模调查已知某地新生儿平均出生体重为3.30kg。从该地难产儿中随机抽取35名新生儿作为研究样本,平均出生体重为3.42kg,标准差为0.40kg,问该地难产儿出生体重与一般新生儿体重有无差异?

总体均数$\mu_0=3.30kg$,总体标准差$\sigma$未知,$n=35$为小样本,$\bar X=3.42kg$,$S=0.40kg$。
出生体重可假设为服从正态分布,选用单样本t检验。

(1)建立检验假设,确定检验水准。
$H_0:\mu = \mu_0$,该地难产儿与一般新生儿平均出生体重相同。
$H_1:\mu \neq \mu_0$,该地难产而与一般新生儿平均出生体重不同。
$\alpha=0.05$

(2)计算检验统计量。
在$\mu = \mu_0$成立的前提条件下,计算统计量为:
$$
t = \frac{\bar X - \mu_0}{S_{\bar X}} = \frac{\bar X - \mu _0}{S/\sqrt{n}} = \frac{3.42-3.30}{0.40/\sqrt{35}} = 1.77
$$

(3)根据P值,做出推断结论。
本例自由度$v=n-1=34$,查t界值表,得$t_{0.05/2,34}=2.032$。因为$t<t_{0.05/2,34}$,故$P>0.05$。按照$\alpha=0.05$水准,不拒绝$H_0$,尚不能人物为该地难产出生体重与一般新生儿体重存在差异。

配对样本均数t检验

「配对样本均数t检验」,简称「配对t检验」,又称「非独立两眼哥白尼均属比较的t检验」。

比较目的:检验两配对样本均数所代表的未知总体均数是否有差别。

配对设计:将受试对象按照「某些重要特征相近」的原则配对。

  1. 同源配对:同一标本的两个部分,随机分配接受两种不同的处理。
  2. 异源配对:将同质受试对象配对分别接受两种处理。
其实我也没搞明白这些东西是什么。但总之就是一一配对。

检验统计量$t$计算公式为:

$$
t = \frac{\bar d - \mu_d}{S_{\bar d}} = \frac{\bar d - 0}{S_{\bar d}} = \frac{\bar d}{S_d/\sqrt{n}}
$$

参数说明:

  • $d$:每对数据的差值
  • $\bar d$:差值的样本均数。
  • $S_d$:差值的样本标准差
  • $S_{\bar d}$:差值样本均数的标准差,即差值的标准误
    • $S_{\bar d} = S_d/\sqrt{n}$
  • $n$:配对样本的对子数
例7-2

某项研究评估咖啡因对运动者心肌血流量的影响,先后测定了12名男性志愿者饮用咖啡前后运动状态下的心肌血流量[$ml/(min \cdot g)$],数据如下表所示。问饮用咖啡前后运动者的心肌血流量有无差异。

编号饮用前饮用后差值 $d$编号饮用前饮用后差值 $d$
14.84.8075.14.11.0
25.14.90.284.93.21.7
36.44.51.994.73.01.7
45.75.40.3103.53.20.3
55.64.70.9115.25.3-0.1
65.33.81.5125.35.10.2

本例$n=12$,$\bar d = 0.8$,$S_d=0.741$。
配对差值$d$可假设为服从正态分布,选用配对t检验。

(1)建立检验假设,确定检验水准。
$H_0:\mu_d = 0$,饮用咖啡前后运动者的心肌血流量差值为0。
$H_1:\mu_d \neq 0$,饮用咖啡前后运动者的心肌血流量差值不为0。
$\alpha=0.05$

(2)计算检验统计量。
先计算差值$d$,如表所示。
计算差值的标准误:
$$
S_{\bar d} = \frac{S_d}{\sqrt{n}} = \frac{0.741}{\sqrt{12}} = 0.214
$$
则在$\mu_d = 0$条件下,检验统计量为:
$$
t = \frac{\bar d}{S_{\bar d}} = \frac{0.8}{0.214} = 3.738
$$

(3)根据P值做出推断结论。
自由度$v = n-1 = 11$,查t界值表,得$t_{0.05/2,11}=2.201$。因为$t>t_{0.05/2,11}$,故$P<0.05$。按照$\alpha=0.05$水准,拒绝$H_0$,接受$H_1$,可以认为饮用咖啡前后运动者的心肌血流量存在差异。

两独立样本均数比较的t检验

「两独立样本t检验」,又称「成组t检验」。适用于完全随机设计下两样本均数的比较

比较目的:检验「两样本所来自的总体」的均数是否相等。

要求

  • 两样本所在总体服从正态分布$N(\mu_1 , \sigma_1^2)$和$N(\mu_2 , \sigma_2^2)$。
  • 两总体方差$\sigma_1^2 = \sigma_2^2$,即符合方差齐性

完全随机设计:将受试对象随机分配到两组中,每组对象分别接受不同的处理,分析比较两组的处理效应。

成组t检验的假设是「两总体均数相等」,即$H_0:\mu_1 = \mu_2$。所以,可以将两样本均数的差值$\bar X_1 - \bar X_2$看作一个统计量,$S_{\bar X_1 - \bar X_2}$就是差值的标准误。

则,在$H_0$成立条件下,成组t检验可视为「样本$\bar X_1 - \bar X_2$」与「已知总体均数$\mu_1 - \mu_2 = 0$」比较的「单样本t检验」。

统计量计算公式为:

$$
t = \frac{(\bar X_1 - \bar X_2) - (\mu_1 - \mu_2)}{S_{\bar X_1 - \bar X_2}} = \frac{\bar X_1 - \bar X_2}{S_{\bar X_1 - \bar X_2}}, v = n_1 + n_2 - 2
$$

其中,$S_{\bar X_1 - \bar X_2}$为两样本均数之差的标准差,也成为差值的标准误。

$$
S_{\bar X_1 - \bar X_2} = \sqrt{S_c^2(\frac{1}{n_1} + \frac{1}{n_2})}
$$

$S_c^2$称为合并方差

$$
S_c^2 = \frac{(n_1 - 1)S_1^2 + (n_2 - 1)S_2^2}{n_1 + n_2 - 2}
$$