Pearson相关系数(Pearson Correlation Coefficient)是一种统计量,用于衡量两个连续变量之间的线性相关程度。其值介于-1和1之间,具体含义如下:
-
当相关系数为1时,表示两个变量之间存在完全正线性关系,即一个变量增大时,另一个变量也增大。
-
当相关系数为-1时,表示两个变量之间存在完全负线性关系,即一个变量增大时,另一个变量减小。
-
当相关系数为0时,表示两个变量之间不存在线性相关关系。
-
相关系数的绝对值越接近于1,相关性越强;越接近于0,相关性越弱。
计算公式为:
[ r = \frac{\sum_{i=1}^{n} (x_i - \bar{x})(y_i - \bar{y})}{\sqrt{\sum_{i=1}^{n} (x_i - \bar{x})^2 \sum_{i=1}^{n} (y_i - \bar{y})^2}} ]
其中,\( x_i \) 和 \( y_i \) 是两个变量的观测值,\( \bar{x} \) 和 \( \bar{y} \) 是它们的样本均值,\( n \) 是样本的数量。
Pearson相关系数广泛应用于各种统计分析中,用于评估两个量化数据间关系的强度和方向