自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 Datawhale 吃瓜教程第5次打卡

本次打卡对应了西瓜书第6章的内容。 西瓜书第6章介绍了支持向量机。本章首先从支持向量机的基本型开始介绍,接着对其使用拉格朗日乘子法得到对偶问题,并给出了对偶问题的一个解法,即SMO算法。此外,本章也介绍了核函数,从而使得训练样本从线性可分扩展到非线性可分。支持向量机的软间隔也是一个重点,从而使得支持向量机更贴近现实任务。 ...

2021-07-30 02:55:44 134

原创 Datawhale 吃瓜教程第4次打卡

本次打卡对应了西瓜书第5章的内容。 西瓜书第5章介绍了神经网络。本章从构成神经网络的最基本组件——神经元开始介绍,并由此引申到由两层神经元组成的感知机,和更多层的多层感知机。在神经网络的训练过程中,大部分情况都会采用反向传播算法,即BP算法,来对参数进行迭代,而反向传播算法正是基于梯度下降法来实现神经网络层级之间的传播的。由于BP神经网络的训练过程是一个参数寻优过程,因此会遇到求解过程中可能会面临局部最小解的问题,本章也对此问题的解决思路进行了简单介绍。此外,本章也介绍了其他几种常见的神经网络,例如RBF

2021-07-26 02:27:52 249

原创 Datawhale 吃瓜教程第3次打卡

本次打卡对应了西瓜书第4章的内容。 西瓜书第4章主要介绍了决策树。首先,本章介绍了最基础的三种决策树,分别以信息增益为准则来划分属性的ID3,以信息增益率为准则来划分属性的C4.5,以基尼系数为准则来划分属性的CART。此外,本章还说明了决策树算法需要通过剪枝处理来应对过拟合的情况。本章的后本部分则阐述如何在决策树中使用连续属性,并给出了连续值和缺失值的处理方法。 ...

2021-07-23 00:28:34 65

原创 Datawhale 吃瓜教程第2次打卡

本次打卡对应了西瓜书第3章的内容。 西瓜书第3章主要介绍了线性模型。该章首先引入了线性回归,通常可用最小二乘法来解决此类问题。其次,该章介绍了对数几率回归,即逻辑回归,它是一种特殊的线性回归,但主要应用于分类问题,而非回归问题。对于对数几率回归,可通过梯度下降法或牛顿法来求解参数的最优解。同时,LDA,多分类问题中的OvO,OvR,MvM,以及分类问题中常见的类别不平衡问题也都在此章有所阐述。 ...

2021-07-20 00:24:17 69

原创 Datawhale 吃瓜教程第1次打卡

本次打卡对应了西瓜书第1/2章的内容。 西瓜书第1章主要介绍了机器学习的概念,基本术语,发展过程,以及当前现状。总的来说,第1章的重点并不多,是一个起到引导作用的章节。 西瓜书第2章主要介绍了模型评估。由于在训练机器学习模型时,很可能会出现过拟合或者欠拟合的情况,导致新样本无法被模型准确地预测。因此,需要对模型的泛化误差进行评估。首先,数据集需要划分为训练集和测试集,其中,训练集用于训练模型,而测试集全程不参与训练,而是用来测试模型对新样本的判别能力。在划分数据集上,基本会选择留出法,交叉验证法,自助法

2021-07-13 22:34:06 71

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除