在进行特征缩放的时候,其一般做法是(X-mu)/sigma
mu:代表均值
sigma:代表标准差
在matlab中,函数mean可以求特征的均值,函数std可以求特征的标准差。
假设训练集为m,特征数量为n,特征矩阵为X,则X的size为 m*n。
则 mu = mean(X)返回值为一个1*n的向量,向量中每个值对应于每个特征的均值。
则 sigma = std(X) 返回值为一个1*n的向量,向量中每个值对应于每个特征的标准差。
为了进行特征缩放,我们需要使用matlab中另外一个函数repmat。
对于repmat函数,可以理解成Repeat Matrix .
官方帮助文档为:
Repeat copies of array。
B = repmat(A,n)
returns an array containing n
copies of A
in the row and column dimensions. The size of B
is size(A)*n
when A
is a matrix.
repmat(A, n)表示分别在行和列上对于矩阵A拷贝n分。
例如:
A=
2 3;
3 4
则B = repmat(A, 2);
B =
2 3 2 3
3 4 3 4 2 3 2 3 3 4 3 4repmat(A, m, n)表示在列方向返回m个A的拷贝,在行方向返回n个A的拷贝。
B = repmat(A, 2, 1)
B =
2 3
3 4 2 3 3 4对于实现特征缩放,可以使用repmat函数来实现,由以上的计算可知:
X 为 m*n 矩阵
mu 1*n 向量
sigma 1*n向量
为了对X中的每一列向量进行特征缩放,使用以下命令即可
X_norm = (X - repmat(mu,size(X,1),1)) ./ repmat(sigma,size(X,1),1);
即,首先将mu使用premat函数为m*n向量,本质为将m个mu向量,按行叠加成矩阵。
X - repmat(mu, size(X,1), 1)
即为X-mu的特征缩放。
对于(X-mu)/sigma的处理方式一样。