「线性回归与相关」是对两个变量之间的关系进行的分析。
线性回归
假设有两个变量$X$和$Y$,当$X$改变时,$Y$也会相应地改变。此时,称$X$为「自变量」或「解释变量」,称$Y$为「因变量」或「响应变量」。
如果$X$和$Y$存在线性关系,可以用「线性回归方程」描述。线性回归方程的一般表达形式为
$$
\hat{Y} = a + b X
$$
符号说明:
- $\hat{Y}$ - 回归方程的预测值。
- $a$ - 回归直线在$Y$轴上的截距,即$X=0$时的介值。
- $b$ - 样本的回归系数,即回归直线的斜率。
回归系数$b$的计算公式
$b$为回归系数,其计算公式为:
$$
b=\frac{l_{XY}}{l_{XX}}=\frac{\Sigma(X-\bar{X})(Y-\bar{Y})}{\Sigma(X-\bar{X})^2}
=\frac{\Sigma XY - \frac{(\Sigma X)(\Sigma Y)}{n}}{\Sigma X^2 - \frac{(\Sigma X)^2}{n}}
$$
由此可得到截距$a$的计算公式:
$$
a=\bar Y - b \bar X
$$
符号说明:
- $l_{XY}$ - $X$与$Y$的离均差积和。
- $l_{XY}$ - $X$的离均差平方和。
估计$b$与$a$的原理是「最小二乘法」,即保证$Q=\Sigma(Y - \hat Y)$最小。