Stanford 机器学习 Week5 作业: Neural Networks: Learning

最新推荐文章于 2020-11-18 23:13:37 发布

Baoli1008

最新推荐文章于 2020-11-18 23:13:37 发布

阅读量1.5k

点赞数

分类专栏：机器学习 Octave 文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Baoli1008/article/details/50766242

版权

机器学习同时被 2 个专栏收录

23 篇文章 0 订阅

订阅专栏

6 篇文章 0 订阅

订阅专栏

randInitializeWeight

epsilon_init = 0.12;
W = rand(L_out, 1 + L_in) * 2 * epsilon_init - epsilon_init;

sigmoidGradient

g = sigmoid(z) .* (1 - sigmoid(z));

nnCostFunction

Theta1 = reshape(nn_params(1:hidden_layer_size * (input_layer_size + 1)), ...
hidden_layer_size, (input_layer_size + 1));

Theta2 = reshape(nn_params((1 + (hidden_layer_size * (input_layer_size + 1))):end), ...
                 num_labels, (hidden_layer_size + 1));
J = 0;
Theta1_grad = zeros(size(Theta1));
Theta2_grad = zeros(size(Theta2));

a1 = [ones(m,1) X];
z2 = a1 * Theta1';
a2 = sigmoid(z2);
a2 = [ones(m,1) a2];
z3 = a2 * Theta2';
preOut = sigmoid(z3);
trueOut = zeros(size(preOut));
for i = 1:m
    trueOut(i,y(i)) = 1;
end

tmp = trueOut .* log(preOut) + (1 - trueOut) .* log(1 - preOut);
J = -1.0/m * sum(tmp(:));
t1 = Theta1(:,2:end) .* Theta1(:,2:end);
t2 = Theta2(:,2:end) .* Theta2(:,2:end);
J = J + lambda / 2 / m * (sum(t1(:)) + sum(t2(:)));

epi3 = (preOut - trueOut)';
epi2 = Theta2(:,2:end)' * epi3 .* sigmoidGradient(z2)';
Theta2_grad  =  (Theta2_grad + epi3 * a2) / m;
Theta1_grad  =  (Theta1_grad + epi2 * a1) / m;


Theta2_grad(:,2:end) = Theta2_grad(:,2:end) + lambda / m * Theta2(:,2:end);

Theta1_grad(:,2:end) = Theta1_grad(:,2:end) + lambda / m * Theta1(:,2:end);

这段代码调了一段时间，虽然题目建议写成loop的，我还是用向量化实现了。
几个重点：
1.ai是包含bias unit的，epi，zi是不包含bias unit的
2.epi是unitnum * m 的，而不是相反

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Baoli1008 CSDN认证博客专家 CSDN认证企业博客

码龄10年

293: 原创

13万+: 周排名

88万+: 总排名

65万+: 访问

: 等级

6895: 积分

69: 粉丝

159: 获赞

32: 评论

285: 收藏

私信

关注

热门文章

分类专栏

数据结构 63篇
水题 43篇
贪心 4篇
图论 31篇
搜索 32篇
数论 15篇
dp 31篇
模拟 17篇
普林斯顿大学MOOC algorithm 1 2篇
计算几何 11篇
python 8篇
linux 5篇
数学 28篇
字符串 16篇
MacOX
JAVA
汇编语言 4篇
minisat 2篇
C++ 4篇
MFC 1篇
Numpy 2篇
机器学习 23篇
Octave 6篇
机器学习实战 1篇
Github 1篇
pandas 2篇

最新评论

补码运算中的溢出
做而论道_CS: 在计算机系统中，正负数值，一律采用补码表示和存储。数值、补码，直接转换即可，无须讨论原码反码。补码的运算，与一般二进制的运算相同。但是，补码运算时，不包括进位位。补码运算的结果，一旦超出表达范围，就是溢出。溢出的表现是：三个符号位，不符合正确的关系。判断是否溢出，看三个符号就行了，不用看原码反码。如：085h + 9ch 　= 1000 0101b + 1001 1100b 　= (1) 0010 0001b 两个负数相加，和，却是正数！不符合正常逻辑，这就是溢出了。又：0e7h + 0b3h 　= 1110 0111b + 1011 0011b 　= (1) 1001 1010b 两负数相加，和，依然是负数。无异常，这就没有溢出。溢出，与进位位，并无关系。与原码，更没有关系。归结起来，补码的溢出判断规则就一句话：同符号数相加，结果的符号位和两加数不同，既是溢出。完全正确。
Python 动态生成变量名
print_bookcase: 怎么用一个类创建多个对象，好几十个那种
Python 动态生成变量名
残存的影子: 文件分割
Python 动态生成变量名
这样啊812: 你调用什么情况需要调用这么多?
Python 动态生成变量名
残存的影子: 写的不明白啊,那我调用呢?还是要一个个写? 还要从1写到100?,那我要他有何用

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。