机器学习初轮廓——很好理解的几个知识点

最新推荐文章于 2024-05-03 11:58:37 发布

Lemon**

最新推荐文章于 2024-05-03 11:58:37 发布

阅读量633

点赞数

分类专栏：机器学习文章标签：机器学习监督学习非监督学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42168614/article/details/80685374

版权

机器学习专栏收录该内容

3 篇文章 0 订阅

订阅专栏

这部分知识主要是通过翻阅书籍来学习的，希望能够对和我一样的小白有所启迪！

1. 机器学习系统具备的特点

在这里就不介绍机器学习的发展历程了，直接总结一下机器学习具备的特点：

许多机器学习系统所解决的都是无法直接使用固定规则或流程代码完成的问题，通常这类问题对人类而言非常简单。比如，计算机和手机中的计算器程序就不属于具备智能的系统，因为里面的计算方法都有清楚而且固定的规程；但是，如果要求一台机器去辨别一张相片中都有哪些人或物体，这对我们人类来讲非常容易，然而机器很难做到。
所谓“具备学习”能力的程序都是指它能够不断地从经历和数据中吸取经验教训，从而应对未来的预测任务。
机器学习系统更加有魅力在于它具备不断完善自身应对具体任务的能力。

总之，如果一个程序在使用既有的经验（E）执行某类任务（T）的过程中被认定为是“具备学习能力的”，那么它一定需要展现出：利用现有的经验（E）,不断改善其完成既定任务（T）的性能的特质（P）.

2. 机器学习三要素

由以上知识可知，机器学习的三要素包括任务、经验、性能，以下详细阐述：

（1）任务

机器学习的任务有很多种类，最为经典的两类即是：监督学习和无监督学习。

监督学习包括分类问题和回归问题，它关注对事物未知表现的预测。

分类问题，就是对其所在的类别进行预测。类别即使离散的，同时也是预先知道数量的。比如已知一个人的身高、体重和三围数据，预测其性别。性别是离散的也是预先知晓数量的。

回归同样是预测问题，知识预测的目标是连续变量。比如根据房屋面积、房间数量来预测房价销售。

非监督学习倾向于对事物本身特性的分析，常用的技术有数据降维和聚类问题。

数据降维是对事物的特性进行压缩和筛选，这比较抽象。如果我们没有特定的领域知识，是无法预先确定采样哪些数据的。如今，筛选有效信息的成本比较昂贵。比如，在识别图像中人脸的任务中，可以直接读取到图像的像素信息，但这样数据的维度非常高。因此，通常会用数据降维技术对图像做预处理，保留最具有区分度的像素组合。

聚类则是依赖于数据的相似度，把相似的样本划分为一个簇。不同于分类，我们在大多数情况下不会预先知道簇的数量和每个簇的具体含义。

（2）经验

我们习惯性地把数据视作经验；事实上，只有那些对学习任务有用的特定信息才会别列入考虑范围。而我们通常把这些反映数据内在规律的信息叫做特征。

对于监督学习问题，我们拥有的经验包括特征和标记/目标（Label/target）两个部分。一般用一个特征向量来描述一个数据样本；标记/目标的表现形式取决于监督学习种类。

无监督学习无法从事预测任务，更加适合对数据结构的分析。

（3）性能

所谓性能，是评价所完成人物质量的指标。为了评价学习模型完成任务的质量，我们需要具备相同特征的数控，并将模型的预测结果同对应的正确答案进行比对。称这样的数据集为测试集。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习初轮廓——很好理解的几个知识点

这部分知识主要是通过翻阅书籍来学习的，希望能够对和我一样的小白有所启迪！1. 机器学习系统具备的特点在这里就不介绍机器学习的发展历程了，直接总结一下机器学习具备的特点：许多机器学习系统所解决的都是无法直接使用固定规则或流程代码完成的问题，通常这类问题对人类而言非常简单。比如，计算机和手机中的计算器程序就不属于具备智能的系统，因为里面的计算方法都有清楚而且固定的规程；但是，如果要求一台机器去辨别一张...
复制链接

扫一扫

专栏目录

Lemon** CSDN认证博客专家 CSDN认证企业博客

码龄6年

25: 原创

8万+: 周排名

221万+: 总排名

42万+: 访问

: 等级

2098: 积分

42: 粉丝

172: 获赞

38: 评论

394: 收藏

私信

关注

热门文章

分类专栏

最新评论

SyntaxError: positional argument follows keyword argument解决方法
2301_79536158: for line in open('../prepare/train_data/train_data0.txt','r',encoding='utf-8').readlines(): corpus.append(line)for line in open('../prepare/train_data/train_data0.txt',encoding='utf-8','r').readlines(): corpus.append(line)
python错误：TypeError: 'module' object is not callable 解决方法
wei1315168: os is not defined 这怎么定义
PageRank算法（一）
古德曼955: 图看不到
Python中find（）与rfind（）的区别
m0_68090611: 我的尝试结果： Python rfind() 返回字符串第一次出现的位置(从右向左查询)，如果没有匹配项不会返回-1，而是会报错。 Python find() 返回字符串第一次出现的位置(从左向右查询)，如果没有匹配项则返回-1。有错请纠正
python错误：TypeError: 'module' object is not callable 解决方法
Code-Z: 谢谢博主，解决了我长时间以来的困惑

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。