机器学习课堂笔记（十七）

最新推荐文章于 2019-11-01 18:43:30 发布

数据纵横

最新推荐文章于 2019-11-01 18:43:30 发布

阅读量356

点赞数

分类专栏：机器学习文章标签：机器学习

本文链接：https://blog.csdn.net/github_27432191/article/details/51418154

版权

机器学习专栏收录该内容

14 篇文章 1 订阅

订阅专栏

机器学习课堂笔记（十七）

<matlab>
cvPredictions = (pval < epsilon);
fp = sum((cvPredictions == 1) & (yval == 0));
<matlab>

cvPredictions == 1和yval == 0是长度
n $=$ length(cvPredictions) $=$ length(yval)的逻辑向量
((cvPredictions == 1) & (yval == 0));是长度n的逻辑向量

这里写图片描述
$x^{(i)}$ 和 $\theta^{(i)}$ 是列向量

这里写图片描述

<matlab>
for i=1:num_movies
    idx=find(R(i,:)==1);
    Theta_temp=Theta(idx,:);
    Y_temp=Y(i,idx);
    X_grad(i,:) = (X(i,:)*Theta_temp'-Y_temp)*Theta_temp;
end

for j=1:num_users
    idx=find(R(:,j)==1);
    X_temp=X(idx,:);
    Y_temp=Y(idx,j);
    Theta_grad(j,:) = (Theta(j,:)*X_temp'-Y_temp')*X_temp;
end
<matlab>

1、计算X_grad(i,:)时，将Theta看作样本集
2、计算Theta_grad(j,:)时，将X看作样本集
3、X(i,:)*Theta_temp'对应Y_temp
4、Theta(j,:)*X_temp'对应Y_temp'

这里写图片描述
对于右图的情况，先增加特征，如果学习曲线变成左图，可以进一步进行基础设施了改善算法。

批量梯度下降计算 $\theta_j$ 需要 $(x^{(1)},y^{(1)}),(x^{(2)},y^{(2)}),\dots,(x^{(m)},y^{(m)})$
随机梯度下降计算 $\theta_j$ 需要 $(x^{(i)}，y^{(i)})$
这里写图片描述
1、随机下降将会在靠近全局最小值附近区域内移动
2、在更新样本的同时， $\theta_j$ 也在同步更新
3、Repeat执行1-10次，取决样本的大小

小批量梯度下降计算 $\theta_j$ 需要 $(x^{(i)},y^{(i)}),(x^{(i+1)},y^{(i+1)}),\dots,(x^{(i+b)},y^{(i+b)})$

这里写图片描述
使用向量化方法能够实现并行计算b个样本值

每次计算 $cost(\theta,(x^{(i)},y^{(i)}))$ ，每1000次计算1次平均值并作图

1、更小的 $\alpha$ 振荡更小，得到更好的参数
2、计算最后5000个 $cost(\theta,(x^{(i)},y^{(i)}))$ 的平均值比计算1000个得到的曲线更平滑
3、曲线上下振动时，增加用来平均的 $cost(\theta,(x^{(i)},y^{(i)}))$ 更能够看出趋势
4、代价值上升时，换更小的 $\alpha$
这里写图片描述
$\theta$ 能够随着用户习惯的变化自动调适

在线学习 $\theta$ ，对于 $x$ ,预测 $y$ 的值

4台机器每台机器计算 $\sum_{i=1}^{400}(h_\theta(x^{i})-y^{(i)})x_j^{(i)}$ 中的100个求和项

数据纵横

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习课堂笔记（十七）

机器学习课堂笔记（十七）<matlab>cvPredictions = (pval < epsilon);fp = sum((cvPredictions == 1) & (yval == 0));<matlab>cvPredictions == 1和yval == 0是长度 n== length(cvPredictions)==length(yval)的逻辑向量 ((cvPredicti
复制链接

扫一扫