机器学习第一课

最新推荐文章于 2022-03-16 22:31:42 发布

fffffffff_jj

最新推荐文章于 2022-03-16 22:31:42 发布

阅读量185

点赞数

分类专栏： AI

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_42347617/article/details/106968631

版权

AI 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

机器学习基础

数据集（data set ）：比如，鸢尾花数据：特征 - 种类（全部数字化）

样本（Sample）:每一行数据

除种类外，每一列表达样本的一个特征（feature）：用矩阵 X描述

第i个样本行写作 $X^{(i)}$ ( 也叫：特征向量) 第i个样本的第j个特征值 $X^{(i)}_j$

标记（label）: 最后一列（种类），也是机器学习的目的（分类），用向量y表示

【注】约定用大写字母表示矩阵，小写字母表示向量

第i个样本的标记写作 $y^{(i)}$

特征空间（feature space）：分类任务本质就是在特征空间进行划分

机器学习的基本任务

分类任务

一系列决策过程

二分类：选还是不选

多分类：选哪个 -> 可以转化为二分类

有些算法天然可以完成多分类任务

多标签分类：

回归任务

标签是一个连续的数字的值，不是类别

预测房屋价格

有些情况：回归任务可以简化为分类任务

分类方法

监督学习

data set 有标记（答案）

比如： KNN，线性回归和多项式回归，逻辑回归，SVM，决策树和随机森林

非监督学习

data set 没有标记，聚类分析

对数据进行降维处理（可视化）

特征提取：丢掉无用特征

特征压缩：PCA（合并相关特征，近似化）

异常检测

半监督学习

部分有标记，部分没标记

先用无监督学习处理，再用监督学习

增强学习

根据周围环境采取行动，得到反馈，不断优化模型

强人工智能

其他分类方法

批量学习 Batch Learning ( 离线学习 Offline Learning)

提前训练出模型（一个黑盒）

优点：简单

问题：如何适应环境变化？ $\rightarrow$ 定时重新批量学习

缺点：运算量大，在某些环境变化很快的情况下，无法适应

在线学习 Online Learning

将输入样例和输出的正确结果，作为样本输入重新迭代进训练

优点：及时反映新的环境变化

问题：新的数据带来不好的变化？ $\rightarrow$ 加强对数据进行监控

参数学习 Parametric Learning

假设统计模型：找参数一旦学到了参数，就不再需要原有的数据集

非参数学习 Nonparametric Learning

不对模型进行建模、假设

【注】非参数不等于没参数！

如何选择机器学习算法？

（KNN，线性回归，多项式回归，逻辑回归，模型正则化，PCA，SVM，决策树，随机森林，集成学习，模型选择，模型调试）

奥卡姆的剃刀：简单的就是好的特定领域可能特定算法更好

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习第一课

机器学习基础数据集（data set ）：比如，鸢尾花数据：特征 - 种类（全部数字化）样本（Sample）:每一行数据除种类外，每一列表达样本的一个特征（feature）：用矩阵 X描述第i个样本行写作 X(i)X^{(i)}X(i)( 也叫：特征向量) 第i个样本的第j个特征值 Xj(i)X^{(i)}_jXj(i)标记（label）: 最后一列（种类），也是机器学习的目的（分类），用向量y表示【注】约定用大写字母表示矩阵，小写字母表示向量第i个样本的标记写作 y(i)y^{
复制链接

扫一扫

专栏目录

fffffffff_jj CSDN认证博客专家 CSDN认证企业博客

码龄6年

359: 原创

25万+: 周排名

64万+: 总排名

12万+: 访问

: 等级

4152: 积分

25: 粉丝

48: 获赞

35: 评论

137: 收藏

私信

关注

热门文章

分类专栏

Concrete Semantics
总结 2篇
leetcode 1篇
AI 3篇
IDE 2篇
数学基础 18篇
数据结构 1篇
Web前端 5篇
数据库 12篇
编译原理 6篇
QT 2篇
C Primer Plus 6篇
算法笔记配套习题 8篇
剑指offer
计算机网络 14篇
c++ 11篇
JAVA 1篇
Pythoh 5篇
English 3篇
hexo
linux 1篇
OJ 12篇
PAT B 79篇
PAT A 166篇

最新评论

PAT A1060 Are They Equal（含样例2、3、4、6数据）
Star_Sapph1re: 样例3的输出应为：0.64300*10^3
[leetcode-1] Two Sum
CSDN-Ada助手: 非常感谢CSDN博主分享的《leetcode-1》Two Sum，这篇博客对于想要深入了解算法和数据结构的读者来说非常有价值。我觉得博主可以继续写关于算法和数据结构方面的文章，比如可以写一篇关于《leetcode-2》Add Two Numbers的博客，这样的技术文章对其他用户也会有很大的帮助。相信会有更多读者受益于你的分享。为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。
7-4 Ambulance Dispatch (30分)
Slatter: 膜拜大佬，写了这么多种方法
7-4 Ambulance Dispatch (30分)
weixin_43602315: 这道题有C语言版本的吗？
7-4 Ambulance Dispatch (30分)
m0_62517654: 在做project3是吧，逮到了（狗头

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。