机器学习引言

最新推荐文章于 2022-09-25 16:58:10 发布

Caaaaaan

最新推荐文章于 2022-09-25 16:58:10 发布

阅读量443

点赞数 2

分类专栏： AIStudy 文章标签：机器学习人工智能 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Hacker_ccc/article/details/125743343

版权

AIStudy 专栏收录该内容

19 篇文章 4 订阅

订阅专栏

定义

赋予计算机学习的能力，这种能力通过非显著编程实现

非显著编程不约束相应的规律,通过经验和样本自主学习

而是通过利益函数，使得机器人自己在特定环境下，用自己的行为获得最大收益

在针对某个任务T和某个性能指标P，从经验E中学习
性能指标P能随着经验E的学习得到提高
典型的最优化过程

经验E和性能指标P是根据算法决定的，算法决定了性能的最终体现

分类

学习任务的分类

教计算机下棋
垃圾邮件识别，教计算机自动识别某个邮件识别是否是垃圾邮件
人脸识别，这个人脸是谁
无人驾驶

可以看到

垃圾邮件识别，教计算机自动识别某个邮件识别是否是垃圾邮件
人脸识别，这个人脸是谁

为同一类，称为监督学习

对于经验E，这一类的样本数据是人工收集起来标签给计算机学习的

为数据样本打标签是高消耗人本的过程

另外两个任务

经验E是由计算机和环境互动获得的

我们的程序，需要对计算机互动的行为编写相应的收益函数

同时改变算法，让计算机自行改变自己的行为模式，去获得最大的收益函数

我们称这一类学习为**“强化学习”**

两个分类并不是完全分开，而是可以相辅相成

监督学习分类

根据数据标签存在与否的分类

一：传统的监督学习
- 每一个训练数据都有对应的标签
- 常用算法：
  - 支持向量机
  - 人工神经网络
  - 深度神经网络
二：非监督学习
- 所有训练数据都没有对应的标签
- 需要假设：同一类的训练数据在空间中距离更近
- 假设成立的前提下，运用样本的空间信息
- 设计算法将它们聚集为两类，从而实现无标签的监督学习
- 常用算法：
  - 聚类
  - EM算法
  - 主成分分析
三：半监督学习
- 训练数据中一部分有标签，一部分没有标签
- 网络中存在大量数据，标注数据耗费人力
- 因此需要，高效利用少类的标注样本数据是个可深入研究的问题

基于标签的固有属性进行分类

一：分类
- 标签是离散的值
- eg：人脸识别
二：回归
- 标签是连续的值
- eg：预测房价走势

算法的过程

机器学习的重点是：假设在已经提取好特征的前提下，如何构造算法获得更好的性能

第一步：特征提取
- 通过训练样本获得，对机器学习任务有帮助的多个维度的特征数据
- 对提取的特征进行特征选择
第二步：基于特征选择算法进行训练**(训练的本质是划分特征空间)**
- 形成一个特征空间，特征空间的维度数目=特征数目
- 不同的机器学习算法，会形成不同的分界线
- 机器学习对高维的运算结果，替代了人类的想象力进行世界探索

没有免费午餐定理

任何一个预测函数，如果在一些训练样本上表现好，那么必然在另一些训练样本上表现不好；如果不对数据在特征空间的先验分布有一定假设，那么表现好与表现不好的情况一样多。（即所有算法的表现都是一样的）

自行瞎猜的适合，正确与错误的概率是一样的

这是因为，我们先验分布的预测假设，本身就是等同的

没有放之四海而皆准的算法

关注

2
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Caaaaaan CSDN认证博客专家 CSDN认证企业博客

码龄3年

44: 原创

39万+: 周排名

11万+: 总排名

3万+: 访问

: 等级

664: 积分

431: 粉丝

183: 获赞

58: 评论

258: 收藏

私信

关注

热门文章

分类专栏

最新评论

CTF-密码学基础
普通网友: 优质好文，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
CTF-密码学基础
普通网友: 优质好文，博主的文章细节很到位，兼顾实用性和可操作性，感谢博主的分享，文章思路清晰【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
卷积神经网络CNN
weixin_1235: 不敢当，我们还是学习。我做sa，没实践过只是看。
卷积神经网络CNN
Caaaaaan: 受教了，现在回头看确实写得不太清晰。感谢指点
卷积神经网络CNN
weixin_1235: 前面很不错，清晰，看过很多，这篇把使用CNN原因和共享参数说明白了。CNN in keras后面没太明白，文章就是让人看明白，不需要想，明白后再去想思维技巧。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Caaaaaan 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。