Skip to content

特征缩放 (Feature scaling)

前导知识:

特征缩放是一种用来对相互独立的变量 (特征值) 的范围进行归一化的方法。 有时它也被称作数据归一化,通常用在数据预处理的过程中。现实生活中的数 据集中通常在数值,范围和单位上都有较大的区别; 如果不进行预处理, 可能会出现下图中的情况: 注意到变量w_1的范围比较狭窄,这会使得梯度下降算法难以找到最快下降的路径。 如果我们对特征值进行缩放, 如下图所示: 此时即可较顺利的找到最速下降路径。

常见的缩放方法有: 1. 最小/最大值缩放; 2. 平均值归一化; 3. Z-score 归一化; 4. 对数变换