线性回归与相关」是对两个变量之间的关系进行的分析。

线性回归

假设有两个变量$X$和$Y$,当$X$改变时,$Y$也会相应地改变。此时,称$X$为「自变量」或「解释变量」,称$Y$为「因变量」或「响应变量」。

如果$X$和$Y$存在线性关系,可以用「线性回归方程」描述。线性回归方程的一般表达形式为

$$
\hat{Y} = a + b X
$$

符号说明:

  • $\hat{Y}$ - 回归方程的预测值。
  • $a$ - 回归直线在$Y$轴上的截距,即$X=0$时的介值。
  • $b$ - 样本的回归系数,即回归直线的斜率。

回归系数$b$的计算公式

$b$为回归系数,其计算公式为:

$$
b=\frac{l_{XY}}{l_{XX}}=\frac{\Sigma(X-\bar{X})(Y-\bar{Y})}{\Sigma(X-\bar{X})^2}
=\frac{\Sigma XY - \frac{(\Sigma X)(\Sigma Y)}{n}}{\Sigma X^2 - \frac{(\Sigma X)^2}{n}}
$$

由此可得到截距$a$的计算公式:

$$
a=\bar Y - b \bar X
$$

符号说明:

  • $l_{XY}$ - $X$与$Y$的离均差积和。
  • $l_{XY}$ - $X$的离均差平方和。

估计$b$与$a$的原理是「最小二乘法」,即保证$Q=\Sigma(Y - \hat Y)$最小。