标准化英文
1、什么是标准化
标准化是通过特征的平均值和标准差,将特征缩放成一个标准的正态分布,缩放后均值为0,方差为1。但即使数据不服从正态分布,也可以用此法。特别适用于数据的最大值和最小值未知,或存在孤立点。
2、为什么要标准化
1)、标准化是为了方便数据的下一步处理,而进行的数据缩放等变换,不同于归一化,并不是为了方便与其他数据一同处理或比较。
2)、标准化后的变量值围绕0上下波动,大于0说明高于平均水平,小于0说明低于平均水平。
3、标准化的方法
Z-score(标准化):
公式:新数据=(原数据-均值)/(标准差)
(z-score标准化方法适用于属性A的最大值和最小值未知的情况)