机器学习

zhao_crystal

已于 2022-06-28 23:18:11 修改

阅读量388

点赞数

分类专栏：算法/ML 文章标签： ML

于 2018-04-20 09:08:29 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zhao_crystal/article/details/80013523

版权

算法/ML 专栏收录该内容

57 篇文章 3 订阅

订阅专栏

目录

一机器学习简介

1. 机器学习的基本流程：

2. 机器学习岗位职责

3. 机器学习分类

3.1 机器学习分类一（根据不同的用途）

3.1.1 监督学习：

3.1.2 非监督学习：

3.1.3 半监督学习

3.2 机器学习分类二（根据是否能适应环境的变化）

3.2.1 批量学习

3.2.2 在线学习

3.3 机器学习分类三（根据参数进行划分）

3.3.1 参数学习

3.3.2 非参数学习（对这个还不是特别理解，后续更新）

3.4 机器学习分类四（单输出和多输出）

4. 机器学习应用举例

二 . 深度学习

1. 深度学习是什么（算法集合）

2. 深度学习能干什么

三. 总结和思考

四. 一些问题

五. 资料收集

一机器学习简介

1. 机器学习的基本流程：

对大量的历史数据，进行学习，从而生成经验模型，利用经验模型指导业务，所以，这里面有2个关键点：数据+模型，其中数据决定了高度，模型决定了达到高度的方法。

2. 机器学习岗位职责

数据处理（采集+去噪）

模型训练（特征+模型）

模型评估与优化（MSE, F1-score，AUC+调参）

模型应用（A/B测试）

3. 机器学习分类

3.1 机器学习分类一（根据不同的用途）

3.1.1 监督学习：

(1)分类：label 是离散的(即预测的是类别), 模型的输出是概率分布

eg:三分类问题输出的例子：[0.2, 0.7, 0.1]

损失函数：

(2)回归：label是连续的(预测的是一个有大小的值）, 模型输出是一个实数值

eg:在这里说预测值更合适，比如房价，无人驾驶中方向盘转动的角度

损失函数：

预测值与真实值的差距

平方差损失

绝对值损失

在一些情况下，可以将连续的预测值量化，从而将回归问题转化为分类问题。

3.1.2 非监督学习：

(1)对数据进行降维：

特征提取：

特征压缩：PCA，将关联度（相似性）高的特征变为一个。

如手写数字的识别，相邻的像素点灰度值近似，因此可用一个像素点代替周围的多个，从而减少特征数量，降低维度

数据降维的意义：数据可视化。如把高维降到二维，三维，方便作图，将数据的具体分布等展现出来，使人们更好的理解。

(2)异常检测

3.1.3 半监督学习

实际中，可能有些样本的标签值（也可以表示回归中的预测值）丢失，有些样本有标签，有些没有标签，则称之为半监督学习。

半监督学习的方法：一般先用非监督学习手段对数据做处理，之后使用监督学习的手段做模型的训练和预测。

3.2 机器学习分类二（根据是否能适应环境的变化）

3.2.1 批量学习

(1)定义：批量学习是指用一批数据将模型训练完成后，训练数据就被丢弃。在实际环境中输入样本，预测样本，模型不再更新。

(2)如何和适应环境的变化？

定时重新批量学习，但计算量大，某些业务可能需要频繁的重新批量学习。

3.2.2 在线学习

(1)定义：

能及时反映新的数据变化，也适用于数据量大，无法完全批量学习的环境。

(2)新的（异常）数据带来不好的影响怎么办？

加强对数据进行异常监控（用到非监督学习中的异常监测功能）

3.3 机器学习分类三（根据参数进行划分）

3.3.1 参数学习

如先假设：f(x)=ax+b,根据点的坐标（样本），训练，学习得到参数a,b的值

3.3.2 非参数学习（对这个还不是特别理解，后续更新）

不对其进行过多的假设，但不代表没有参数。

3.4 机器学习分类四（单输出和多输出）

4. 机器学习应用举例

分类问题——图像识别，垃圾邮件识别

回归问题——股价预测，房价预测

聚类问题——分组

排序问题——点击率预估，推荐

生成问题——图像生成，图像风格转换，图像文字描述生成

二 . 深度学习

1. 深度学习是什么（算法集合）

卷积神经网络

循环神经网络

自动编码器

稀疏编码

深度信念网络

限制玻尔兹曼机

深度学习+强化学习=深度强化学习

2. 深度学习能干什么

以卷积神经网络和循环神经网络为例

三. 总结和思考

四. 一些问题

五. 资料收集

深度学习有关课程 Google工程师亲授 Tensorflow2.0入门到进阶-慕课网实战

参考文献

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
机器学习

一机器学习简介1. 机器学习的基本流程：2. 机器学习岗位职责数据处理（采集+去噪）模型训练（特征+模型）模型评估与优化（MSE, F1-score，AUC+调参）模型应用（A/B测试）3. 机器学习分类3.1 机器学习分类一（根据不同的用途）监督学习：(1)分类：label 是离散的(2)回归：label（在这......
复制链接

扫一扫

专栏目录

zhao_crystal CSDN认证博客专家 CSDN认证企业博客

码龄8年

180: 原创

3万+: 周排名

110万+: 总排名

58万+: 访问

: 等级

4854: 积分

643: 粉丝

241: 获赞

44: 评论

1263: 收藏

私信

关注

分类专栏

资源 1篇
大数据 6篇
java 2篇
生活 1篇
golang
搜推广 7篇
算法/leetcoode 2篇
理财
面试 1篇
爬虫 2篇
book
Redis 7篇
python 59篇
matlab 4篇
math 4篇
算法/ML 57篇
linux 17篇
virtualenv 1篇
windows操作 8篇
numpy 1篇
通信 4篇
web 5篇
mac 11篇
加密算法 2篇
深度学习 30篇
Docker 3篇

最新评论

Decimal.quantize
拾拿九稳: 引用「为什么在这里四舍了？」你想说的是“五舍”吧
tensorflow dataset基础之——dataset api的使用
Sincer: 你对 interleave 的理解有误，请参考https://blog.csdn.net/menghuanshen/article/details/104240189
Out-Of-Vocabulary（OOV）的理解
m0_68703577: 说了个屁屁
Decimal.quantize
姜川JC: 讲的真的很仔细，能否结合保留有效数字讲解一下呢？萌新有些搞不懂
tensorflow基础之——tf.feature_column, tf.estimator, pre_estimator
ccut20091767: train_df = pd.read_csv(train_file) train_df 你都read了，还套到dataset？

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。