机器学习

最新推荐文章于 2024-05-02 21:46:15 发布

cj1064789374

最新推荐文章于 2024-05-02 21:46:15 发布

阅读量137

点赞数

分类专栏：机器学习（MOOC笔记原理）

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/cj1064789374/article/details/85859424

版权

机器学习（MOOC笔记原理）专栏收录该内容

29 篇文章 1 订阅

订阅专栏

机器学习

监督学习supervised learning：给计算机看哪些图片是猫，哪些图片是狗，让他去分辩，就是学习这些标签可以代表那些图片，当然也可以用于股票涨跌，房价预测，神经网络也属于此范筹

无监督学习un-supervised learning：只提供猫与狗照片，但没说哪些是猫，哪些是狗，让其自行总结不同之处进行划分

半监督学习semi-supervised learning：少量有标签样本与大量无标签样本进行识别与分类

强化学习reinforcement learning：规划机器人行为准则，把计算机丢到一个对于它完全陌生的环境，或让它完成从未接触过的任务，例如让机器人学投篮，只给一个球，投进了就有分，让其自行尝试各种方法

遗传算法genetic algorithm：淘汰弱者，适者生存，例如让计算机打超级玛利奥

神经网络：

人工神经网络：不会有新神经元产，我已经知道吃糖时手会如何动，靠正向与反向传播进行误差项传递来更新误差系统

神经网络neural network

卷积神经网络convolutional neural network

循环神经网络recurrent neural network

长短期记忆long short-term memory

自编码autoencoder

生成对抗网络generative adversarial nets

梯度下降法gradient descent

迁移学习transfer learning

神经网络技巧：

检验神经网络evaluation，（交叉验证）

特征标准化feature normalization，房价预测时先把数据化为0至1区间内或均值为0

好特征good features，避免无意义信息，重复性信息，复杂信息

激励函数activation function，非线性方程，AF（）卷积relu,循环sigmoid,tanh，必须可微分，因为要把误差反向传递

过拟合overfitting，插值时边界偏差太大，分类问题边界复杂，法一加大数据量，法二数据正规化，Y=WX，L1：COST=(WX-REAL Y)^2+ABS（W），L2：COST=(WX-REAL Y)^2+W*W，L3L4就是换成三次方四次方

加速神经网络训练speed up training，stochastic gradient descent，Momentum，Adagrad，RMSProp，Adam

不平衡数据imbalanced data，法一：准确率accuracy与误差cost，法二：confusion matrix , precision & recall , f1 score (or f-score)，法三重组数据，支四使用其他机器学习方法

批标准化batch normalization

L1/L2正规化reglarization，误差J(c)=[yc(x)-y]2+入[ c1*c1+c2*c2 +…]，平方是L2,ABS是L1

强化学习：reinforcement：

理解环境Model-Based RL与不理解环境Model-Free RL

基于概率Policy-Based RL与基于价值Value-Based RL

回合更新monte-carlo update与单步更新temporal-difference update

在线学习on-policy与离线学习off-policy

Q learning：找最短路，Sarsa：找最安全路

Sarsa(lambda)：

Deep Q Network：Q LEARNING中加入深度神经网络

Policy Gradients：对每回合策略打分控制其权重

Actor Critic：对每步策略打分控制其权重

Deep Deterministic Policy Gradient：四个网络，策略梯度与基于价值都有估计与现实网络

Asynchronous Advantage Actor-Critic：并行优势

AlphaGo Zero：不需学习原有棋谱

进化学习：

遗传算法genetic algorithm

进化策略evolution strategy

神经网络进化neuro-evolution，进化算法比传统的梯度算法慢，但能达全局最优，若能实现并行强化，则能比梯度算法更优

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习

机器学习监督学习supervised learning：给计算机看哪些图片是猫，哪些图片是狗，让他去分辩，就是学习这些标签可以代表那些图片，当然也可以用于股票涨跌，房价预测，神经网络也属于此范筹无监督学习un-supervised learning：只提供猫与狗照片，但没说哪些是猫，哪些是狗，让其自行总结不同之处进行划分半监督学习semi-supervised learning：少量有...
复制链接

扫一扫

专栏目录

cj1064789374 CSDN认证博客专家 CSDN认证企业博客

码龄7年

548: 原创

3万+: 周排名

133万+: 总排名

60万+: 访问

: 等级

9148: 积分

272: 粉丝

497: 获赞

106: 评论

1659: 收藏

私信

关注

热门文章

分类专栏

最新评论

运算放大器11种经典电路
做而论道_CS: 同向放大器、反向放大器？应该说：同相放大器、反相放大器。
计算机组成浮点数补码规格化负数表示范围
做而论道_CS: 至于移码，可以理解为：　对二进制数的 ”加密、解密“。加密：二进制数＋偏移量＝移码。解密：移码－偏移量＝二进制数。偏移量，是神马数值呢？　在不同的应用场合，偏移量有不同的数值。　　到时候，你就知道了。这种加解密的方法，也太简单了！　小事一桩，不值一提。
计算机组成浮点数补码规格化负数表示范围
做而论道_CS: 另外，由补码换算到十进制数，也极其简单。你只需记住：【补码首位的权，是负数】。一般的八位二进制数，各个位的权是：　　128、64、32、16、8、4、2、1；如果是八位的补码，各个位的权则是：　－128、64、32、16、8、4、2、1。　例如，有一个补码：1110 0001，它代表的十进制是：－128 + 64 + 32 + 1= －31。再看，另一个补码：0110 0001，它代表的十进制是：0 + 64 + 32 + 1 = ＋97。仅仅使用【进制转换】，不就完事了！－－－－－－－－－－－－－－－－－－－－－－那么，所谓的：　机器数真值符号位原码反补码正数三码与正数相同　负数取反加一符号位不变符号位也参加运算模同余 ... 这一大堆乱七八糟的概念，不都是垃圾嘛！进位，是小学二年级的知识点吧？　舍弃进位，很难理解吗？　老外竟然能弄出那么大一堆概念！　老外的数学水平，由此可见一斑。谁要是跟老外学算术，立刻、马上，直接就掉沟里去了！我们的计算机老师，也不懂数学，只知道跟风。　一天一天的，在大学里，兜着圈子讲小学的知识。　真是毁人不倦坑人不浅！这些老师，捡个鞋拔子就当成玉如意了。　天天蒙骗学生，赚取名声和丰厚的讲课费。　　顺便再抓几个学生挂科，抖一下威风！现在知道我们缺芯片用的原因了吧！
计算机组成浮点数补码规格化负数表示范围
做而论道_CS: 在两位十进制中，舍弃进位，就是【减去了一百】。因此，加 99、再减 100，当然就是 “－1” 了。同理，+98，就是 “－2” 。。。。　。。。二进制数，也是数，并非是什么原码反码补码。八位二进制数就是：0000 0000 ~ 1111 1111。就相当于十进制数：0 ~ 255。如果有进位，就是：256。那么，加 255、减 256，也就是 “－1” 了！所以，+255 (1111 1111)，就是－1。同理，+254 (1111 1110)，就是－2。　　　+253 (1111 1101)，就是－3。　　　。。。　。。。最后，+128 (1000 0000)，就是－128。以上这些正数，就是计算机专家 “发明” 的补码。你如果上过中学，你一定能导出关系式：　负数的补码 = 256 ＋该负数。一般化，就是：　负数的补码 = 2^n ＋该负数。　n，是二进制数的位数。例：求－31 的 “补码” 是多少？解：256－31 = 225 = 1110 0001 (二进制)。这不就求出来了吗？哪里还用：符号位原码反码取反加一！同样，求正数的补码，也是用此公式：　正数的补码 = 2^n ＋该正数。　n，是二进制的位数。但是，正数加上 2^n，就会出现进位。进位必须舍弃，所以，2^n 就不用加了。因此，你就可以简化公式如下：　正数的补码 = 该正数。在此处，你就证明了：　零和正数的补码，就是该数本身。计算机专家，也曾这么说过。　但是，他们并没有给出证明。为什么呢？　因为，他们弄不懂什么是舍弃进位。
计算机组成浮点数补码规格化负数表示范围
做而论道_CS: 虽然，计算机使用的是：二进制数。但是，二进制数，也是数。　并不是什么：机器数原码反码补码。二进制数本身，就是真值。所谓的 “补码”，也不仅仅是二进制才有。任意的进制，都有 “补码” 存在。你看十进制吧，两位数，就是：0 ~99。可以有：27 + 99 (一百) 26 　　　　27 － 1 = 26 只有你忽略进位，仍然取两位数，　这两种算法，就是相同的。即，舍弃进位，就可以：　用正数，当做负数；　用加法，实现减法运算。在计算机中，舍弃进位，会怎样？　能够简化硬件。　只用一个加法器，便可横行天下！你如果懂得什么是【舍弃进位】，　你就能理解 “补码” 的来历与意义。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。