机器学习（周志华）第三章习题3.10的理解

最新推荐文章于 2022-06-22 21:51:40 发布

nilgnaw

最新推荐文章于 2022-06-22 21:51:40 发布

阅读量386

点赞数 1

文章标签：机器学习

本文链接：https://blog.csdn.net/nilgnaw/article/details/106859886

版权

10.试推出多分类代价敏感学习(仅考虑基于类别的错误分类代价)使用“再缩放”能获得理论最优解的条件。

个人理解，题目的重点是能否获得最优解，以及获得最优解的条件。

能获得理论最优解的条件是其二阶导数>0。

再缩放之后，二分类情况下，预测为正例的可能性从y变为 ${y}'=\frac{y*cost^-}{cost^++y(cost^--cost^+)}$ 。

多分类情况下，y'变为 $y_{i}^{'}$ ，再带入估计函数。

在对ω和b进行估计的时候，需要看y对估计函数的二阶导数的值是否有影响，若有影响，则需进一步分析y和分类代价的取值范围（即条件），若无影响，y和分类代价值可能会对求解过程有影响。

同时，如书中所说，再缩放的实际操作并不平凡。不知道这个问题是否也会影响求理论最优解。

对于题目中要求的推导，不太清楚要怎么做。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

nilgnaw

关注关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

周志华《机器学习》课后习题个人解答

01-30

周志华《机器学习》课后习题个人解答。各算法都拿numpy和pandas实现了一遍

西瓜书学习笔记day3

数学废狒进化史

09-28

510

西瓜书学习笔记3，线性模型

参与评论您还未登录，请先登录后发表或查看评论

《机器学习》读书笔记2--线性模型

tiantizzz的博客

01-18

800

线性模型基本形式线性模型试图学的一个通过特征属性的线性组合来进行预测的函数。可以理解为，有一组特征属性D，，其中是在第个属性上的取值。线性模型要通过特征属性D来确定如下这样的线性组合，其中主要目标则是确定和b。和b学得后，整个模型就得以确定。举个简单的例子，在判断是否为好的西瓜这一问题上，我们想通过线性模型来预测，则有：其中的[0.2,0.5,0.3]就是，[色泽，根蒂，敲声]是属性集合D。线性回归线性回归是试图学得一个线性模型（如上面的线性组合），来尽可能的...

机器学习（3） -- 线性模型

weixin_43575791的博客

04-11

286

3.1 基本形式 w直观表达了各属性在预测中的重要性，因此线性模型有很好的解释性 3.2 线性回归对离散属性，若属性值之间存在“序”关系，可通过连续化将其转化为连续值，如高矮可转换为{1,0}，高中低可转化为{1,0.5,0}；若属性之间不存在序关系，假设有K个属性值，则通常转化为k维向量，如西瓜、南瓜、黄瓜可转化为（0,0,1），（0,1,0），（1,0,0）均...

《机器学习》周志华第三章课后习题

huzimu_的博客

03-16

6674

3.1 试析在什么情形下式(3.2) 中不必考虑偏置项 b.

《机器学习》周志华课后习题答案——第三章 (1-7题)

最新发布

10-17

为了训练一个真正有效、优化的模型，需要学习一下机器学习的理论知识。周志华的教材非常经典，但概念较多，特别是前两章，在学习中作了笔记，现分享出来，希望能有帮助。

机器学习周志华课后习题编程题，Python实现

01-02

3.5，编程实现线性判别分析，并给出西瓜数据集3.0a上的结果。 4.10 从网上下载或自己编程实现...8.5 试编程实现 Bagging，以决策树桩为基学习器，在西瓜数据集 3.0α 上训练一个 Bagging 集戚，井与图 8.6 进行比较.

Datawhale打卡周志华机器学习第四章

09-21

Datawhale打卡周志华机器学习第四章

《机器学习(周志华)》学习笔记.pdf

05-12

138页的内容，完整记录了学周志华西瓜书《机器学习》16个篇章的学习和体会。

周志华《机器学习》第三章课后习题

qq_40694323的博客

06-22

8988

目录3.1 试析在什么情形下式(3.2) 中不必考虑偏置项 b.3.2、试证明，对于参数w,对率回归的目标函数(3.18)是非凸的,但其对数似然函数(3.27)是凸的. 3.3、编程实现对率回归,并给出西瓜数据集3.0α上的结果.3.4 选择两个 UCI 数据集，比较 10 折交叉验证法和留一法所估计出的对率回归的错误率。3.5 编辑实现线性判别分析，并给出西瓜数据集 3.0α 上的结果. ①b与输入毫无关系，如果没有b，y‘=wx必须经过原点 ②当两个线性模型相减时，消除了b。可用训练集中每个样本都减去第

机器学习(周志华) 参考答案 第三章 线性模型 3.3

濯君

08-28

6149

一：matlab实现 1.数据的Excel处理 2.代码 # -*- coding: utf-8 -*- old_l = 0; n = 0; b = [0;0;1]; %对应书中（3.25）下的B=(w;b)，因为x有两个属性：密度，含糖率，所以有b三行，还有一个是w*x+b中的b。 x = xlsread('E:\Program Files\octave\西瓜3.0.xlsx'...

周志华《机器学习》课后习题（第三章）：线性模型

红色石头的专栏

05-09

8059

作者 |我是韩小琦链接 | https://zhuanlan.zhihu.com/p/432708303.1 试分析在什么情况下，在以下式子中不比考虑偏置项b。答：在样本中有某一个...

机器学习-周志华-课后习题答案-线性模型

天台的猫爷爷的博客

01-17

1万+

3.1试分析在什么情况下，在以下式子中不比考虑偏置项b。答：在线性回归中，所有参数的确定都是为了让残差项的均值为0且残差项的平方和最小。在所有其他参数项确定后，偏置项b（或者说是常数项）的变化体现出来的就是拟合曲线的上下整体浮动，可以看做是其他各个解释变量留下的bias的线性修正。因此在线性拟合过程中是需要考虑偏置项的。但若需要做的是比较不同自变量对因变量的影响，那么不需要考虑常数项，这样得到的回

周志华版机器学习第三章习题答案

weixin_43518584的博客

04-17

1万+

原文参考链接：https://blog.csdn.net/icefire_tyh/article/details/52065224 习题 3.1 3.2 如果一个多元函数是凸的，那么它的Hessian矩阵是半正定的 3.3 #导入需要的包 import numpy as np import matplotlib.pyplot as plt from sklearn.model_selectio...

周志华《机器学习》第三章线性模型笔记+习题

AIGC Studio：分享AIGC前沿知识和好玩应用，公众号同名。

05-16

1万+

第3章线性模型所谓线性模型，也即是： 1. 假定示例有dd个属性，x=(x1,x2,...,xd)x=(x1,x2,...,xd) 2. 试图通过属性的线性组合进行预测 f(x)=∑i=1dwixi+b f(x)=∑i=1dwixi+b 用向量形式表示就是： f(x)=wTx+b f(x)=wTx+b 线性模型虽然简单，但却是基础。先研究线性、单属性的线性回归问题，便可以进一步研究非线...

《机器学习》周志华 --第3章线性模型思维导图+笔记+习题

weixin_45775701的博客

11-14

3666

基本形式问题描述：给定由d个属性描述的示例x=(x1;x2;x3…xd)，其中xi是x的第i个属性上的取值，线性模型试图学得一个通过属性的线性组合来进行预测函数，函数形式：f(x) = w1x1+w2x2+…wdxd+b, 向量形式：例：西瓜问题中学的“f好瓜（x）=0.2x色泽+0.5x根蒂+0.3*x敲声+1”，则意味着可通过综合考虑色泽、根蒂和敲声来判断瓜好不好，由式子可以看出，其中根蒂最要紧，而敲声比色泽更重要。非线性模型可以在线性模型的基础上通过引入层级结构或高维映射而得。线性回归

机器学习 周志华 第三章 推导详细过程

weixin_37076955的博客

03-21

1071

第三章主要介绍了线性模型的推导过程，但是作者略去部分简单的步骤，虽然作者认为是简单的，但是对我这种数学渣渣来说，并不简单，因此我还是差了 matriccookbook中的矩阵运算的公式，自己推导了一遍。首先推导公式（3.10）到公式（）令导数=0，则可以求出参考公式如上图，取自 wiki百科上计算公式。未完待续。 ...

《机器学习》西瓜书习题第 3 章

云玩家

01-26

2329

习题 3.1 试析在什么情况下式 (3.2)(3.2)(3.2) 中不必考虑偏置项 bbb . 　　书中有提到, 可以把 xxx 和 bbb 吸收入向量形式 w^=(w;b)\hat{w} = (w;b)w^=(w;b) .此时就不用单独考虑 bbb 了. 　　其实还有很多情况不用, 比如说使用了 one−hot\mathrm{one-hot}one−hot 编码, 就可以不用考虑偏置项. 　　更...

机器学习周志华课后题第三章

04-06

1. 什么是泛化能力？泛化能力和过拟合之间有什么关系？泛化能力是指模型在新的、未见过的数据上的表现能力。模型的泛化能力与其对训练数据的拟合程度有关，通常来说，过拟合的模型泛化能力较差。 2. 什么是交叉验证？交叉验证的作用是什么？交叉验证是一种通过将数据集分成若干个子集来进行模型评估的方法。具体地，将数据集分成k个子集，每个子集都轮流作为测试集，其余子集作为训练集，重复k次，最终得到k个模型的评估结果的平均值。交叉验证的作用是提高模型评估的可靠性和泛化能力。 3. 留出法、k折交叉验证和留一法的区别是什么？它们各自适用于什么情况？留出法是将数据集分成两部分，一部分作为训练集，另一部分作为测试集。留出法适用于数据集较大的情况。 k折交叉验证是将数据集分成k个子集，每个子集都轮流作为测试集，其余子集作为训练集，重复k次，最终得到k个模型的评估结果的平均值。k折交叉验证适用于数据集较小的情况。留一法是k折交叉验证的一种特殊情况，即将数据集分成n个子集，每个子集都作为测试集，其余子集作为训练集，重复n次。留一法适用于数据集较小且样本数较少的情况。 4. 为什么要对数据进行预处理？数据预处理的方法有哪些？数据预处理可以提高模型的表现，并且可以减少过拟合的风险。数据预处理的方法包括：标准化、归一化、缺失值填充、特征选择、特征降维等。 5. 什么是特征选择？特征选择的方法有哪些？特征选择是指从所有特征中选择出对模型预测结果有重要贡献的特征。特征选择的方法包括：过滤式方法、包裹式方法和嵌入式方法。其中，过滤式方法是基于特征间的关系进行特征选择，包裹式方法是基于模型的性能进行特征选择，嵌入式方法是将特征选择嵌入到模型训练中。