WEEK2.2.3 特征缩放法

发表于 2021-05-12 更新于 2021-08-08 分类于 ML 阅读次数：评论：

本文字数： 420 阅读时长 ≈ 1 分钟

特征缩放法

特征缩放法（Feature Scaling）是梯度下降中的一个实用技巧,可以使梯度下降算法更快地收敛。

通常如果多个特征范围之间与-1到1范围相差不大也是可以接受的，不是必须将特征缩放到-1到1之间。但是也别太大或太小。不用过分担心特征是否在完全相同的范围或区间内，只要他们足够接近的话，梯度下降算法就能正常工作。

均值归一化（mean normalization）

如果有一个特征xi，就用\[x_i - \mu_i\]替换，其中\[\mu_i\]为训练集中特征\[x_i\]的均值，通过这样能够让你的特征值具有为0的平均值。特征缩放不需要太精确，只是为了让梯度下降算法更快收敛，即让梯度下降所需的循环次数更少。

https://www.coursera.org/learn/machine-learning/supplement/CTA0D/gradient-descent-in-practice-i-feature-scaling