西瓜书第一二章学习体会

最新推荐文章于 2024-09-28 11:36:52 发布

阿呆喵

最新推荐文章于 2024-09-28 11:36:52 发布

阅读量60

点赞数

文章标签：算法

本文链接：https://blog.csdn.net/weixin_60101862/article/details/132849324

版权

一、回归与分类问题的定义：

根据标记的取值类型不同，机器学习任务可分为以下2类：

1、当标记取值为离散值时，称此类任务为“分类”。例如：西瓜分为好瓜、坏瓜。

当学习类别只有2个时----称为二分类

当学习类别超过2个时---称为多分类

2、当标记取值为连续值时，此类任务为“回归”。例如股票股价预测，新能源发电功率预测。

二、根据是否有用到标记信息，也可将机器学习任务分为以下两类：

用到标记信息，则为“监督学习”；没有用到，则为“无监督学习”。

三、独立同分布

详细概念是：假设样本空间服从一个未知的分布“D”，收集到的样本都是独立地从该分布中采样得到，即所谓的“独立同分布”。

有个栗子比较好理解：扔骰子，每次扔的结果都是独立不相关的。但若要求骰子两次之和大于某一个值，那么第一次和第二次仍就不独立，因为第二次仍的结果和第一次相关。

四、归纳偏好

记结论即可：哪个算法得到的模型在测试集上的效果好，算法就好。

五、数据决定模型上限，算法让模型无限逼近上限

数据质量很差，再怎么学习，也预测不准。

充分良好的数据情况下，不同算法存在适应性，测试集上效果好的，算法就好，预测出来的结果也会逼近真实。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

阿呆喵

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

西瓜书第一二章总结笔记

06-14

自学西瓜书入门机器学习

机器学习西瓜书学习笔记第一章和第二章

07-18

文章，机器学习西瓜书学习笔记第一章和第二章，同步markdown文件。持续更新中...

1 条评论您还未登录，请先登录后发表或查看评论

机器学习西瓜书第二周学习笔记

01-23

机器学习西瓜书第二周学习笔记机器学习西瓜书第二周学习笔记中涵盖了机器学习的基础知识和重要概念。在本周的学习中，我们将了解机器学习的定义、类型、应用场景和常见算法。首先，让我们从机器学习的定义开始。...

西瓜书机器学习的学习笔记（十分详细）

06-10

西瓜书《机器学习》-第二章模型评估与选择代码实现.zip

10-19

1、选取某UCI分类数据集，划分数据集，用10折交叉验证，选用两个现成的分类算法（或者一个算法、参数不同），得到分类模型A和B，给出交叉验证预测结果。 2、对两模型的交叉验证预测结果，分别给出混淆矩阵、P、R和F1...

二叉树最小深度

2301_80161204的博客

09-27

457

25[0, 105]

使用Python实现图形学的纹理映射算法

qq_42568323的博客

09-27

1269

纹理映射的基本概念是将二维图像（纹理）应用于三维模型的表面，以便在渲染时提供更多的细节和视觉效果。纹理坐标生成：为每个顶点生成对应的纹理坐标，通常使用归一化的二维坐标系统。纹理采样：根据生成的纹理坐标从纹理图像中获取颜色值。光照计算：结合光照模型，计算最终颜色，产生更真实的效果。图像合成：将计算得到的颜色与其他渲染信息合成，生成最终图像。纹理映射不仅可以用于简单的颜色填充，还可以模拟表面细节、光照变化等，提升渲染效果。

904. 水果成篮

YQ20210216的博客

09-27

357

转化，找出一个最长的子数组长度，子数组中不超过两种类型的水果，要记录水果类型和水果数量，所以要使用unord_map，key来记录水果中类，valuse记录水果数量，当right开始增加的时候，将水果种类加入到哈希表中，当水果中类超过两种时，控制left使得水果种类回到两种。你想要尽可能多地收集水果。你正在探访一家农场，农场从左到右种植了一排果树。这些树用一个整数数组。，返回你可以收集的水果的。

【优选算法】（第一篇）

weixin_73861555的博客

09-25

1087

这个⽅法是往后我们学习「快排算法」的时候，「数据划分」过程的重要⼀步。如果将快排算法拆解的话，这⼀段⼩代码就是实现快排算法的「核⼼步骤」。

代码随想录算法训练营|226.翻转二叉树、 101. 对称二叉树、 104.二叉树的最大深度、 111.二叉树的最小深度

cccoffer的博客

09-27

391

这里只是取最小值是不正确的，因为一旦有一个节点的左或右节点出现了空，此时这个位置成为了最小值，但是不符合题意的，题意是到叶子节点的最小深度。首先交换当前节点的左右子节点，然后递归当前节点的左右子节点（相当于到了子节点还是做同样的操作），知道所有节点遍历完了，就完成了翻转，返回root即可。思路：这题的就是区分高度和深度的题目，不过也可以用求高度的方法求得（即求根节点的高度即可，这个就是用到了后序遍历），求深度就是从根节点开始遍历，直到找到最深的叶子节点即可（相当于前序遍历），这里用前序遍历的方式解题。

560. 和为 K 的子数组

mrjieke6的博客

09-24

299

子数组是数组中元素的连续非空序列。

【反素数】

Kent的博客

09-28

385

【代码】【反素数】

算法训练营打卡Day14

Zoe_igxgx的博客

09-25

270

题目1.226.翻转二叉树题目2.101. 对称二叉树。

python 实现linear discriminant analysis线性判别分析算法

luthane的博客

09-26

515

线性判别分析（Linear Discriminant Analysis，简称LDA）是一种用于降维和分类的监督学习算法。它通过最大化类间散度和最小化类内散度来找到最佳投影方向，使得不同类别的数据在新的空间中尽可能分开，同一类别的数据尽可能靠近。LDA的基本思想LDA的基本思想是将多维数据映射到低维空间，同时保留数据之间的类别差异。具体来说，LDA通过计算类内散度矩阵（描述同一类别内部数据的分布情况）和类间散度矩阵（描述不同类别之间的差异），然后求解这两个矩阵的广义特征值问题，找到最佳的投影方向。

只出现一次的数字 II

程序猿进阶

09-25

1189

对于数组中非答案的元素，每一个元素都出现了 3 次，对应着第 i 个二进制位的 3 个 0 或 3 个 1，无论是哪一种情况，它们的和都是 3 的倍数（即和为 0 或 3）。既然我们在对两个整数进行普通的二元运算时，都是将它们看成整体进行处理的，那么我们是否能以普通的二元运算为基础，同时处理所有的二进制位？这样一来，对于数组中的每一个元素 x，我们使用位运算 (x >> i) & 1 得到 x 的第 i 个二进制位，并将它们相加再对 3 取余，得到的结果一定为 0 或 1，即为答案的第 i 个二进制位。

【算法】模拟：（leetcode）495.提莫攻击（easy）

m0_73726899的博客

09-24

590

模拟 + 分情况讨论。

算法-区间和

最新发布

m0_67281369的博客

09-28

295

第一行输入为整数数组 Array 的长度 n，接下来 n 行，每行一个整数，表示数组的元素。随后的输入为需要计算总和的区间，直至文件结束。给定一个整数数组 Array，请计算该数组在每个指定区间内元素的总和。输出每个指定区间内元素的总和。

leetcode-数组篇7

h17802535087的博客

09-25

659

这一题目中，我们每个节点保存该位置及左上方所有数的和，这样右下角的点减去其他几个点，就得到了四个点围成的区域的和。思路：刚才题目的升级版（当然也可以用上一题的方法做，不过这样get不到该题目的核心）思路：题目很简单，一看就是前缀和的题目，类似的题目还有leetcode560等题目。思路：这个题目很有意思，做过的人一眼就知道怎么做了，没做过的可能要想半天。其实就是从左往右，记录每个数左边的乘积，再从右往左，记录每个数右边的乘积。PS：类似的题目还有leetcode上的分糖果等题目，需要左右各遍历一遍。

力扣之打家劫舍（python）

qq_67728952的博客

09-26

392

你是一个专业的小偷，计划偷窃沿街的房屋。每间房内都藏有一定的现金，影响你偷窃的唯一制约因素就是相邻的房屋装有相互连通的防盗系统，。给定一个代表每个房屋存放金额的非负整数数组，计算你，一夜之内能够偷窃到的最高金额。[1,2,3,1]4偷窃 1 号房屋 (金额 = 1) ，然后偷窃 3 号房屋 (金额 = 3)。偷窃到的最高金额 = 1 + 3 = 4。12偷窃 1 号房屋 (金额 = 2), 偷窃 3 号房屋 (金额 = 9)，接着偷窃 5 号房屋 (金额 = 1)。

西瓜书8章集成学习习题8.7

07-12

西瓜书（也称为《统计学习方法》）的第八章确实讨论了集成学习，而习题8.7通常涉及如何构建和理解集成模型，比如随机森林（Random Forest）或梯度提升机（Gradient Boosting）。这类题目可能会让你设计一个简单的集成模型，例如通过组合多个决策树来进行预测，并探究其性能优势，如减少过拟合、提高泛化能力。集成学习习题8.7可能会涉及以下几个方面： 1. **模型构建**：描述如何生成多个基础模型（如决策树），并说明选择它们的理由。 2. **投票机制**：解释如何通过投票（如多数投票法）或平均预测结果来整合各个模型的预测。 3. **权重分配**：如果涉及到有监督的学习任务，可能会讨论如何为每个基础模型分配适当的权重。 4. **评估**：分析集成模型与单个模型在训练集和测试集上的性能对比，探讨集成学习的效果。