单样本t检验
「单样本t检验」适用于来自「正态分布」的某个样本均数$\bar{X}$与已知总体均数$\mu _0$的比较。
比较目的:检验样本均数$\bar X$所代表的总体均数$\mu$是否与已知总体均数$\mu _0$有差别。
单样本t检验用于总体标准差$\sigma$未知的资料,其统计量t值计算公式为:
$$
t = \frac{\bar X - \mu_0}{S_{\bar X}} = \frac{\bar X - \mu _0}{S/\sqrt{n}}, v= n - 1
$$
参数说明:
- $S$:样本标准差
- $n$:样本含量
例7-1
以往通过大规模调查已知某地新生儿平均出生体重为3.30kg。从该地难产儿中随机抽取35名新生儿作为研究样本,平均出生体重为3.42kg,标准差为0.40kg,问该地难产儿出生体重与一般新生儿体重有无差异?
总体均数$\mu_0=3.30kg$,总体标准差$\sigma$未知,$n=35$为小样本,$\bar X=3.42kg$,$S=0.40kg$。
出生体重可假设为服从正态分布,选用单样本t检验。
(1)建立检验假设,确定检验水准。
$H_0:\mu = \mu_0$,该地难产儿与一般新生儿平均出生体重相同。
$H_1:\mu \neq \mu_0$,该地难产而与一般新生儿平均出生体重不同。
$\alpha=0.05$
(2)计算检验统计量。
在$\mu = \mu_0$成立的前提条件下,计算统计量为:
$$
t = \frac{\bar X - \mu_0}{S_{\bar X}} = \frac{\bar X - \mu _0}{S/\sqrt{n}} = \frac{3.42-3.30}{0.40/\sqrt{35}} = 1.77
$$
(3)根据P值,做出推断结论。
本例自由度$v=n-1=34$,查t界值表,得$t_{0.05/2,34}=2.032$。因为$t<t_{0.05/2,34}$,故$P>0.05$。按照$\alpha=0.05$水准,不拒绝$H_0$,尚不能人物为该地难产出生体重与一般新生儿体重存在差异。
配对样本均数t检验
「配对样本均数t检验」,简称「配对t检验」,又称「非独立两眼哥白尼均属比较的t检验」。
比较目的:检验两配对样本均数所代表的未知总体均数是否有差别。
配对设计:将受试对象按照「某些重要特征相近」的原则配对。
- 同源配对:同一标本的两个部分,随机分配接受两种不同的处理。
- 异源配对:将同质受试对象配对分别接受两种处理。
其实我也没搞明白这些东西是什么。但总之就是一一配对。
检验统计量$t$计算公式为:
$$
t = \frac{\bar d - \mu_d}{S_{\bar d}} = \frac{\bar d - 0}{S_{\bar d}} = \frac{\bar d}{S_d/\sqrt{n}}
$$
参数说明:
- $d$:每对数据的差值。
- $\bar d$:差值的样本均数。
- $S_d$:差值的样本标准差。
- $S_{\bar d}$:差值样本均数的标准差,即差值的标准误。
- $S_{\bar d} = S_d/\sqrt{n}$
- $n$:配对样本的对子数。
例7-2
某项研究评估咖啡因对运动者心肌血流量的影响,先后测定了12名男性志愿者饮用咖啡前后运动状态下的心肌血流量[$ml/(min \cdot g)$],数据如下表所示。问饮用咖啡前后运动者的心肌血流量有无差异。
编号 饮用前 饮用后 差值 $d$ 编号 饮用前 饮用后 差值 $d$ 1 4.8 4.8 0 7 5.1 4.1 1.0 2 5.1 4.9 0.2 8 4.9 3.2 1.7 3 6.4 4.5 1.9 9 4.7 3.0 1.7 4 5.7 5.4 0.3 10 3.5 3.2 0.3 5 5.6 4.7 0.9 11 5.2 5.3 -0.1 6 5.3 3.8 1.5 12 5.3 5.1 0.2
本例$n=12$,$\bar d = 0.8$,$S_d=0.741$。
配对差值$d$可假设为服从正态分布,选用配对t检验。
(1)建立检验假设,确定检验水准。
$H_0:\mu_d = 0$,饮用咖啡前后运动者的心肌血流量差值为0。
$H_1:\mu_d \neq 0$,饮用咖啡前后运动者的心肌血流量差值不为0。
$\alpha=0.05$
(2)计算检验统计量。
先计算差值$d$,如表所示。
计算差值的标准误:
$$
S_{\bar d} = \frac{S_d}{\sqrt{n}} = \frac{0.741}{\sqrt{12}} = 0.214
$$
则在$\mu_d = 0$条件下,检验统计量为:
$$
t = \frac{\bar d}{S_{\bar d}} = \frac{0.8}{0.214} = 3.738
$$
(3)根据P值做出推断结论。
自由度$v = n-1 = 11$,查t界值表,得$t_{0.05/2,11}=2.201$。因为$t>t_{0.05/2,11}$,故$P<0.05$。按照$\alpha=0.05$水准,拒绝$H_0$,接受$H_1$,可以认为饮用咖啡前后运动者的心肌血流量存在差异。
两独立样本均数比较的t检验
「两独立样本t检验」,又称「成组t检验」。适用于完全随机设计下两样本均数的比较。
比较目的:检验「两样本所来自的总体」的均数是否相等。
要求
- 两样本所在总体服从正态分布$N(\mu_1 , \sigma_1^2)$和$N(\mu_2 , \sigma_2^2)$。
- 两总体方差$\sigma_1^2 = \sigma_2^2$,即符合方差齐性。
- 若两者方差不齐,详见方差不齐时两样本均数的比较。
完全随机设计:将受试对象随机分配到两组中,每组对象分别接受不同的处理,分析比较两组的处理效应。
成组t检验的假设是「两总体均数相等」,即$H_0:\mu_1 = \mu_2$。所以,可以将两样本均数的差值$\bar X_1 - \bar X_2$看作一个统计量,$S_{\bar X_1 - \bar X_2}$就是差值的标准误。
则,在$H_0$成立条件下,成组t检验可视为「样本$\bar X_1 - \bar X_2$」与「已知总体均数$\mu_1 - \mu_2 = 0$」比较的「单样本t检验」。
统计量计算公式为:
$$
t = \frac{(\bar X_1 - \bar X_2) - (\mu_1 - \mu_2)}{S_{\bar X_1 - \bar X_2}} = \frac{\bar X_1 - \bar X_2}{S_{\bar X_1 - \bar X_2}}, v = n_1 + n_2 - 2
$$
其中,$S_{\bar X_1 - \bar X_2}$为两样本均数之差的标准差,也成为差值的标准误。
$$
S_{\bar X_1 - \bar X_2} = \sqrt{S_c^2(\frac{1}{n_1} + \frac{1}{n_2})}
$$
$S_c^2$称为合并方差。
$$
S_c^2 = \frac{(n_1 - 1)S_1^2 + (n_2 - 1)S_2^2}{n_1 + n_2 - 2}
$$