注:本文转载自https://github.com/ysh329/Chinese-UFLDL-Tutorial
因为github上的makedown格式显示的不够完全,看的非常不方便,因此放到CSDN上比较好查阅学习。
向量化(Vectorization)
对于如房价数据的小数据量任务,通常使用线性回归,因为代码不需要执行地非常快。尽管您在练习 1A 和 1B 里是建议使用 for 循环的,但对于较大规模的问题, for 循环的执行效率就比较低了。这是因为在 MATLAB 里,按顺序执行整个样本的循环是缓慢的。为了避免(使用) for 循环,想要重写(这部分)代码,使其能尽可能地在 MATLAB 里高效地执行向量或矩阵操作(这点同样适用于其他语言,包括 Python,C/C++ —— 要尽可能地重用已经优化过的操作,这里特指使用向量计算库来优化计算效率)。
下面是一些在 MATLAB 里各种向量化的操作方法。
案例:多矩阵-向量相乘(Example: Many matrix-vector products)
经常一次计算多个矩阵或矢量的乘积(矩阵乘法)。例如,当对数据集(其中,参数
θ
可能是一个二维矩阵或矢量)中的每个样本计算
θ⊤x(i)
。要形成一个包含整个数据集样本的矩阵
X
,可以将每个输入样本的元素或者向量(按照行或列)
因此,对于所有的样本
所以,当执行线性回归(Linear Regression)时,可以通过计算 θ⊤X 求得所有的 y(i)=θ⊤X(i) ,以避免 for 循环对所有样本的遍历。
案例:标准化向量(Example: normalizing many vectors)
假设有前文说到的由众多向量
x(i)
连接形成的矩阵
X
,同时要对所有的
X_norm = sqrt( sum(X.^2,1) );
Y = bsxfun(@rdivide, X, X_norm);
第一行代码,先对
X
中的所有元素做平方操作,所有元素再按列相加得到行向量,最终对行向量中的每个元素做开平方根操作。最后得到的是一个 bsxfun
函数的作用可以看成是对变量 Xnorm
的扩展或者复制,便会得到与矩阵
X
维度相同的矩阵,然后对该矩阵中逐个元素应用二元操作函数(匿名函数 @rdivide
对同维矩阵的同位置的所有元素,实现右除操作)。上述例子中,实现了用二元操作函数对每个元素 bsxfun
可以与几乎所有的二元操作函数使用(例如,@plus,@ge或@eq),更多详情可以查看 bsxfun
的 MATLAB 文档。
案例:梯度计算的矩阵乘法(Example: matrix multiplication in gradient computations)
在线性回归的梯度计算中,其形式可概括为:
当有通过单个索引(公式中的
i
)与其它几个固定索引(公式中的
因此,由于矩阵的整体计算思想,不需要逐个
j
索引依次计算,实际只需计算
% X(j,i) = j'th coordinate of i'th example.
% y(i) = i'th value to be predicted; y is a column vector.
% theta = vector of parameters
y_hat = theta'*X; % so y_hat(i) = theta' * X(:,i). Note that y_hat is a *row-vector*.
g = X*(y_hat' - y);
进一步优化练习 1A 和 1B(Exercise 1A and 1B Redux)
返回您练习的 1A 和 1B 代码中,在 ex1a_linreg.m
和 ex1b_logreg.m
文件中,您将发现调用 minFunc
时分别使用的是文件 linear_regression_vec.m
和 logistic_regression_vec.m
,但却是被注释掉的,而不是用 linear_regression.m
和 logistic_regression.m
文件。在本次练习中,请您将 linear_regression_vec.m
和 logistic_regression_vec.m
里的代码以(前文所讲过的)向量化的方式实现并补充完整。将 ex1a_linreg.m
和 ex1b_logreg.m
文件中的注释取消掉,并比较二者代码的运行时间,检验(现在的代码)是否和先前原本的代码得到的结果是一样的。