机器学习西瓜书——基础知识篇

最新推荐文章于 2024-10-17 19:27:27 发布

zqzqzqmilk

最新推荐文章于 2024-10-17 19:27:27 发布

阅读量79

点赞数 2

文章标签：机器学习人工智能

本文链接：https://blog.csdn.net/zqzqzqmilk/article/details/139814967

版权

第一章基础概念

样本：X

标记：Y, 二分类时取值 y = {0，1}；连续性样本取值 y = R

备注：这个和我们的基因型文件与表型样本表示上相反。

泛化：

“数据决定模型效果的上限” ：数据量（大）和特征工程（合理细致）

“算法则是让模型无限逼近上限” ：效果好最好

假设空间：确定假设空间——机器学习算法——得到模型

版本空间：假设空间的集合

第二章模型评估与选择

这一部分有很多公式推导，因为我主要学习如何使用，所以推导细节没有很详细的学习。这部分我学到的模型评估方法可以说MSE等。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

zqzqzqmilk

关注关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

机器学习西瓜书——第五章神经网络

qq_44941689的博客

06-26

1990

神经网络是由具有适应性的简单单元组成的广泛并行互连的网络，它的组织能够模拟生物神经系统对真实世界物体所作出的交互反应。误差逆传播算法(BackPropagation,简称BP)是迄今为止最成功的神经网络学习算法。通常说“BP网络”时，一般是指用BP算法训练的多层前馈神经网络。一般来说，标准BP算法每次更新只针对单个样例，参数更新得非常频繁，而且对不同样例进行更新的效果可能出现“抵消”现象。因此，为了达到同样的累积误差最小化，它在读取整个训练集D一遍后才对参数进行更新，其参数更新的频率低得多。但在很多任务

机器学习思考题目——01基础知识篇

南瓜派三蔬

03-05

3514

（1）本文直译自《hands on ML》课后题。（有改动的以【】表示）。（2）基础篇就是原书PART 1，不包括神经网络和深度学习的部分。 1.你怎么定义机器学习？ 机器学习是建立一个可以从数据中进行学习的系统。学习是指给定评价标准之后，在某些任务上（的表现）可以越来越好。 2.你能说出机器学习发挥重要作用的四类问题么？ 机器学习在以下复杂问题上效果显著：（a）目前没有算法方案来解决这个问题...

1 条评论您还未登录，请先登录后发表或查看评论

【机器学习西瓜书学习笔记——计算学习理论】

m0_51148715的博客

08-12

810

对一个指示函数集，如果存在hhh个样本能够被函数集中的函数按所有可能的2h2^h2h种形式分开，则称函数集能够把hhh个样本打散。函数集的VCVCVC维就是它能打散的最大样本数目hhh。若对任意数目的样本都有函数能将它们打散，则函数集的VCVCVC维是无穷大。VCVCVC维是一个评判模型复杂程度的工具。VCVCVC维越大则模型的复杂度越高。一般情况下，假设空间的VCVCVC维约等于假设自由变量的数目。

【机器学习西瓜书学习笔记——半监督学习】

m0_51148715的博客

08-13

792

SVM。

《机器学习西瓜书》学习笔记——第一章_绪论整理

欢迎光临啊噗不是阿婆主的酒馆

09-01

435

1. 机器学习应用领域和案例 1.1应用领域数据挖掘：数据之间的关系计算机视觉自然语言处理语音识别机器人决策 1.2 案例血糖值的预测有无糖尿病的预测图像分类目标检测语义分割场景理解文本分类输出文本摘要翻译问答人机对话 image to text end to end(端到端)级自动驾驶玩赛车游戏(...

周志华《机器学习》西瓜书笔记——更到第5章

wzixuan1的博客

02-14

851

监督学习supervised learning=有导师学习：训练数据拥有标记信息，如分类、回归无监督学习unsupervised learning=无导师学习：训练数据没有标记信息，如聚类分类classification：欲预测的是离散值的一类学习任务，例如好瓜or坏瓜回归regression：欲预测的是连续值聚类clustering：即将训练集中的西瓜分成若干组簇cluster：每一个组

【一起啃西瓜书】机器学习-期末复习（不挂科）

热门推荐

风口IT猪的成长录

12-11

2万+

【机器学习-期末复习爆肝2w字笔记整理分享】《机器学习》致力于研究如何通过计算的手段，利用经验来改善系统自身的性能，从而在计算机上从数据（经验）中产生“模型”，用于对新的情况给出判断（利用此模型预测未来的一种方法）。分为三类：监督学习、元监督学习、强化学习。

机器学习——西瓜书笔记

qq_45256352的博客

11-01

1108

目录第一章绪论1.1 引言1.2 基本术语第一章绪论 1.1 引言研究目标 机器学习致力于，研究如何通过计算手段，利用经验（通常以数据形式出现）来改善系统自身的性能。研究内容 机器学习所研究的主要内容，是关于在计算机上从数据中产生“模型”(model)的算法，即学习算法（learning algorithm）。有了学习算法，我们把经验数据提供给它，它就能基于这些数据产生模型；当面对新的情况时，模型会给出相应的判断。注 “模型”泛指从数据中学得的结果，有文献用“模型”指全局性结果（例

【一起啃西瓜书】机器学习-期末复习

风口IT猪的成长录

12-09

8563

西瓜书——对数几率回归（知识点：极大似然估计）

baidu_38356450的博客

12-07

2710

对数几率回归是二分类的问题，我们可以将随机变量yyy假设服从伯努利分布，即yyy的取值只有{0,1}。这里需要补充一个概念，指数族分布，伯努利分布就属于指数族分布。（注：ϕ\phiϕ指的是yyy取1是的概率）我们都明白对数几率回归是从线性回归衍生而来的，所以我们下一步就是进行对数几率回归模型的推导。对数几率回归的广义线性模型推导对于广义线性模型，有三条假设。符合这三条假设的模型便是广义...

西瓜书——决策树（知识点：信息熵的数学含义及推导）

baidu_38356450的博客

12-10

1173

对于决策树，有点像if...elseif...elseif...else语句。最重要的点就是找到合适的属性来划分类别。对于那个用来划分类别的属性要符合一个条件，那就是划分后，集合的纯度提高了。所以我们往往是在一堆属性中，找到一个属性，该属性最能提高集合的纯度。本文将重点解释信息熵的数学含义。一、信息熵信息熵Ent(D)Ent(D)Ent(D)是用来度量样本集合纯度的最常用指标。 Ent(D)=...

机器学习1——什么是机器学习

NoBug

03-05

357

1. 知道什么是机器学习**************** 2. 指定了个学习计划，不断完善******

【可看】On the Generalization of GAN Image Forensics

sinat_39223177的博客

10-17

网络的输入是真实图像和假图像，图像大小为128x128。该网络是一个二值分类器，有四个卷积层，所有卷积步幅为2，填充为1，所有卷积核大小为4x4。通过对真假图像进行相似的图像级预处理，破坏不稳定的低电平噪声线索，迫使取证模型学习更多的内在特征来对生成的和真实的人脸图像进行分类。图像预处理操作位于整个网络架构的前面，其中图像预处理操作可以是平滑滤波或添加噪声。，从而迫使取证分类器学习更多内在和有意义的特征，而不是生成模型的风格。方法的网络架构使用一个简单的DCGAN[17]网络的鉴别器网络。

12、论文阅读：利用生成对抗网络实现无监督深度图像增强

DQHNB的博客

10-17

385

提高图像的美学质量是一个挑战，并且受到公众的广泛关注。为了解决这个问题，大多数现有算法基于监督学习方法，旨在为成对数据学习一个自动照片增强器，该数据由低质量照片及其对应的专家修饰版本组成。然而，专家修饰的照片的风格和特征可能无法满足普通用户的需求或偏好。本文提出了一种无监督图像增强生成对抗网络（UEGAN），该网络以无监督的方式从一组具有期望特征的图像中学习相应的图像到图像映射，而不是依赖于大量的成对图像。所提出的模型基于单一深度GAN，嵌入了调制和注意力机制，以捕捉更丰富的全局和局部特征。

探索机器学习中的特征选择技术

Envyᥫᩣ的博客

10-11

328

特征选择是机器学习项目中的重要环节，通过选择合适的特征，可以提高模型的性能和可解释性。在实际应用中，应根据数据特点和问题需求选择合适的特征选择方法。未来，随着深度学习和自动化特征选择技术的发展，特征选择领域将迎来更多创新和突破。在机器学习和数据科学领域，特征选择是一个关键步骤，它不仅有助于提高模型的性能，还能帮助我们更好地理解数据。本文将深入探讨特征选择的重要性、常见方法以及如何在实际项目中应用这些技术。首先，导入必要的库和数据集，然后使用过滤法选择与目标变量高度相关的特征，最后训练模型并评估性能。

机器学习和深度学习之间区别和联系

huanfeng_AI的博客

10-17

492

机器学习机器学习是人工智能的一个分支，它使计算机能够从数据中进行自我学习并改进算法，而无需显式编程。它利用算法让计算机能够在无明确编程的情况下进行学习和决策，是一种数据分析技术。机器学习起源于20世纪50年代，随着计算机技术的发展和数据量的增加，逐渐形成了多种算法和模型，如决策树、支持向量机、k-均值聚类、逻辑回归等。深度学习深度学习是机器学习的一个子领域，它使用神经网络模型，尤其是深层神经网络模型，来处理、解释和分类数据。深度学习模型通常包含多个隐层，可以学习更加复杂的特征表示。

NCU-机器学习-作业4：基于XGboost的收入分类预测