机器学习进阶第一节第六课

最新推荐文章于 2021-04-19 23:47:49 发布

我是小白呀

最新推荐文章于 2021-04-19 23:47:49 发布

阅读量1.3k

点赞数 1

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_46274168/article/details/110802865

版权

Pyhton 机器学习进阶同时被 2 个专栏收录

32 篇文章 15 订阅

订阅专栏

Python 机器学习进阶第一节

17 篇文章 1 订阅

订阅专栏

机器学习简介

机器学习组成
- 表示 (模型): Representation
- 评价 (策略): Evalution
开发应用程序的步骤
数据类型
- 离散型数据
- 连续型数据
机器学习算法分类
- 监督学习 (预测)
- 无监督学习

机器学习组成

机器学习 = 模型 + 策略 + 算法

其实机器学习可以表示为: Learning = Representation + Evalution + Optimzation. 机器学习主要由三部分组成, 即: 表示 (模型), 评价 (策略) 和优化 (算法).

表示 (模型): Representation

表示主要做的就是建模, 故可以称为模型. 模型要完成的主要工作是转换: 将实际问题转换成为计算机可以理解的问题, 就是我们平时是的建模. 类似于传统的计算学科中的算法, 数据结构, 如何将实际的问题转换成计算机可以表示的方式. 这部分即 “简单的机器学习算法”. 给定数据, 我们怎么区域选择对应的问题去解决, 选择正确的已有的模型是重要的一步.

评价 (策略): Evalution

评价的目标是判断已建好的模型的优劣. 对于第一步中建好的模型, 评价是一个指标, 用于表示模型的优劣. 这里就会是一些评价的指标以及一些评价函数的设计. 在机器学习中会有针对性的评价指标.

优化: Optimization

优化的目标是评价的函数, 我们是希望能够找到最好的模型, 也就是说评价最高的模型.

开发应用程序的步骤

收集数据

我们可以使用很多方法收集样本护具, 如: 制作网络爬虫从网站上抽取数据, 从 RSS 反馈或者 API 中得到信息, 或设备发送过来的实测数据.

准备输入数据

得到数据之后, 必须确保数据格式符合要求.

分析输入数据

这一步的主要作用是确保数据集中没有垃圾数据. 如果是使用信任的数据来源, 那么可以直接跳过这个步骤.

训练算法

机器学习算法从这一步才正宗开始学习. 如果使用无监督学习算法, 由于不存在目标变量值, 故而也不需要训练算法, 所有与算法相关的内容在测试算法中.

测试算法

这一步将实际运用机器学习得到的知识信息. 当然在这也需要评估结果的准确率, 然后根据需要重新训练你的算法.

使用算法

转化为应用程序, 执行实际任务. 以检验上述步骤是否可以在实际环境中正常工作. 如果碰到新的数据问题, 同样需要重复执行上述的步骤.

数据类型

按照机器学习的数据分类我们可以将数据分成:

标称型: 标称型目标变量的结果只在有限目标集中取值, 如真与假 (标称型目标变量主要用于分类)
数值型: 数值型目标变量则可以从无限的数值集合中取值, 如 0.100, 42.001 等 (数值型目标变量主要用于回归分析)

按照数据的本身分布特性:

离散型
连续型

离散型数据

离散型数据: 由记录不同类别个体的数目所得到的数据, 又称计数数据. 所有这些数据全部都是整数, 而且不能再细分, 也不能进一步提高他们的精确度.

连续型数据

变量可以在某个范围内取任意一数, 即变量的取值可以是连续的. 如: 长度, 时间质量等. 这类帧数通常是非整数, 含有小数部分

注: 只要记住一点, 离散型是区间内不可分, 连续型是区间内可分.

机器学习算法分类

分类是监督学习的一个核心问题. 在监督学习中, 当输出变量取有限个离散值时, 预测问题变成为分类问题. 最基础是二分类问题, 即判断是非, 从两个类别中选择一个作为预测结果/

监督学习 (预测)

分类: k-近邻算法, 贝叶斯分类, 决策树与随机森林, 逻辑回归, 神经网络
回归: 线性回归, 岭回归
标注: 隐马科夫模型

无监督学习

聚类: k-means

我是小白呀

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
机器学习进阶第一节第六课

机器学习简介机器学习组成表示 (模型): Representation评价 (策略): Evalution开发应用程序的步骤收集数据准备输入数据分析输入数据训练算法测试算法使用算法机器学习组成机器学习 = 模型 + 策略 + 算法其实机器学习可以表示为: Learning = Representation + Evalution + Optimzation. 机器学习主要由三部分组成, 即: 表示 (模型), 评价 (策略) 和优化 (算法).表示 (模型): Representation表示主要
复制链接

扫一扫

专栏目录

我是小白呀

CSDN认证博客专家 CSDN认证企业博客

码龄4年

Python领域优质创作者

743: 原创

7078: 周排名

1465: 总排名

189万+: 访问

: 等级

3万+: 积分

6万+: 粉丝

5073: 获赞

4821: 评论

1万+: 收藏

私信

关注

热门文章

分类专栏

最新评论

PyTorch 图像识别实战
m0_56572891: 没有数据集来源，此博客写的毫无意义
【Python 零基础入门】Numpy 常用函数通用函数 & 保存加载
一个双鱼座的测开: 这篇关于【Python 零基础入门】Numpy 常用函数通用函数 & 保存加载教程为零基础学习者提供了一个全面的 Numpy 入门指南，涵盖了 Numpy 的常用函数和通用函数的使用方法，以及如何有效地保存和加载 Numpy 数据。通过本教程，你将能够快速上手 Numpy，为数据分析和科学计算打下坚实的基础。的文章写的太好了，完全是我想要学习的,大佬的文章让我对这领域的技术问题有了更深入的了解，尤其是大佬提到的那些“坑点”，我相信能够在实际应用中避免或解决很多问题。谢谢大佬的分享，期待大佬的更多精彩文章，让我们共同学习、进步
【Python 零基础入门】常用内置函数再探
阿J~: 学到了，一起加油。欢迎回赞哦！
指向未来: 量子纠缠的本质是一个指针
张无忌打怪兽: 果然优秀的博主才能写出这么优秀动人的博客，知识点详细清晰，干货满满，对我有很大的帮助，三连支持博主创作出更加优质的博客,同时也希望博主能对我的文章指点一番呐
【Python 零基础入门】Numpy 常用函数通用函数 & 保存加载
我是小白呀: 谢谢

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。