第三章线性模型

最新推荐文章于 2024-06-09 09:14:59 发布

遨游的菜鸡

最新推荐文章于 2024-06-09 09:14:59 发布

阅读量2k

点赞数 1

分类专栏：机器学习周志华(西瓜书)

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_34405401/article/details/104870837

版权

本文介绍了线性模型中的偏置项b的作用，以及在数据归一化后的考虑。讨论了线性可分数据的非线性处理，特别是通过映射到高维空间进行线性判别分析。还提到了十折交叉验证和留一法，并分析了错误分类码长为7的条件和影响，强调了分类器泛化误差和相互独立性的重要性。

摘要由CSDN通过智能技术生成

文章目录

题
数据集3.0α
3.1
3.2
3.3
3.4
- 十折交叉验证法
- 留一法
3.5
3.6
3.7
- 文献：https://download.csdn.net/download/qq_34405401/12251598
3.8
3.9
3.10

参考：https://blog.csdn.net/snoopy_yuan/article/details/64921495

题

在这里插入图片描述

数据集3.0α

在这里插入图片描述

3.1

$f(x)=\omega^{T} x+b$ 中， $\omega^{T}$ 和b有各自的意义，简单来说， $\omega^{T}$ 决定学习得到模型(直线、平面)的方向，而b则决定截距，当学习得到的模型恰好经过原点时，可以不考虑偏置项b。偏置项b实质上就是体现拟合模型整体上的浮动，可以看做是其它变量留下的偏差的线性修正，因此一般情况下是需要考虑偏置项的。但如果对数据集进行了归一化处理，即对目标变量减去均值向量(也可以是随便一个样本)，此时就不需要考虑偏置项了。

3.2

在这里插入图片描述

3.3

import numpy as np
import matplotlib.pyplot as plt
import numpy.linalg as ln
from sklearn.linear_model import LogisticRegression

# 读取数据,其中前8个是好瓜，后9个是坏瓜,一共17个数据
density = np.array([0.697,0.774,0.634,0.608,0.556,0.403,0.481,0.437,0.666,0.243,0.245,0.343,0.639,0.657,0.360,0.593,0.719])
sugar = np.array([0.460,0.376,0.264,0.318,0.215,0.237,0.149,0.211,0.091,0.267,0.057,0.099,0.161,0.198,0.370,0.042,0.103])
goodMelon=np.array([1,1,1,1,1,1,1,1,0,0,0,0,0,0,0,0,0])
#1.准备数据
X

最低0.47元/天解锁文章

遨游的菜鸡

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

遨游的菜鸡 CSDN认证博客专家 CSDN认证企业博客

码龄9年

154: 原创

23万+: 周排名

40万+: 总排名

25万+: 访问

: 等级

2676: 积分

81: 粉丝

158: 获赞

37: 评论

755: 收藏

私信

关注

热门文章

分类专栏

python 26篇
深度学习 7篇
MySQL 4篇
paper 6篇
主动学习 4篇
pytorch 14篇
杂记 16篇
机器学习 7篇
算法与数据结构 9篇
项目实训 9篇
c++ 9篇
机器学习周志华(西瓜书) 11篇
前端 4篇
requests 5篇
scrapy 5篇
CS224N NLP 5篇
统计学习方法 11篇
tensorflow 12篇
kaggle 2篇

最新评论

解决深度学习PyTorch，TensorFlow中GPU、CPU利用率较低的问题
Tengfei Wang: 我们两个的GPU加速明显能对比出差距，我的慢很多
解决深度学习PyTorch，TensorFlow中GPU、CPU利用率较低的问题
Tengfei Wang: 而且我们的深度学习环境也都是一样的，cuda、cudnn、torch等环境都完全一样，为什么会出现了利用率一个为0一个为100%的两种情况呢？
解决深度学习PyTorch，TensorFlow中GPU、CPU利用率较低的问题
Tengfei Wang: 同样的模型，同样的电脑配置，同样的显卡驱动，为什么我的显卡利用率一直是0，显存能吃满，而别人的利用率一直是100%？
主动学习框架
境界面上的双曲线: 博主，我想请问一下，如果我们自己建立一个深度学习模型与主动学习器结合，在不断往训练集里面加新的数据的过程中，我们如何才能知道自己的深度学习模型里的参数才是最优的呢？因为单独使用深度学习的时候，我们会多次训练调参以尽量达到最优参数，但是与主动学习结合加新数据的过程中，我们并不知道自己的模型参数是不是最优的，如果在不断加新数据的过程中调参数的话，感觉前后查询数据的模型就变了（相同模型不同参数）
主动学习框架
境界面上的双曲线: 请问一下你知道结果了吗？回归模型是不是这些查询策略都不适用啊？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。