西瓜书习题一

最新推荐文章于 2024-01-15 16:08:20 发布

JYCG

最新推荐文章于 2024-01-15 16:08:20 发布

阅读量255

点赞数

分类专栏：机器学习文章标签：机器学习算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_50122942/article/details/126841917

版权

机器学习专栏收录该内容

2 篇文章 0 订阅

订阅专栏

版本空间
版本空间：可能存在多个假设与训练集一致，假设的集合称为版本空间，概况说来，版本空间就是从假设空间剔除了与正例不一致和与反例一致的假设，它可以看成是对正例的最大泛化。
假设空间: 所有假设组成的空间，表1.1对应的假设空间的大小为3(*、青绿、乌黑)x4(*、蜷缩、稍蜷、硬挺)x4(*、浊响、清脆、沉闷)+1( $\empty$ )=49种，其中版本空间为：

(色泽=青绿;根蒂=*;敲声=*)
(色泽=*;根蒂=蜷缩*;敲声=*)
(色泽=*;根蒂=*;敲声=浊响)
(色泽=青绿;根蒂=蜷缩;敲声=*)
(色泽=青绿;根蒂=*;敲声=浊响)
(色泽=*;根蒂=蜷缩;敲声=浊响)
(色泽=青绿;根蒂=蜷缩;敲声=浊响)

2.析合范式

不考虑冗余的情况下
假设空间大小为49，去掉空集，k的最大取值为48，但是48种假设中包含很多冗余，例如三属性泛化就包含了所有的假设。
考虑冗余
48种假设中

泛化属性个数	种数
0	2x3x3=18
1	1x3x3+2x1x3+2x3x1= 21
2	2x1x1+1x3x1+1x1x3=8
3	1

所以 $k > 18$ 就存在冗余，所以特征向量是18个，所有假设都可以对应到18个中的某一个，后面的我自己就想不太明白了。
参考

涉及归纳偏好
选择满足最多的假设，但是可能是满足噪声多。
舍弃所有相同属性但是不同分类的数据，但是就丢失了部分信息。
相同属性出现了两种不同的分类，则认为它属于与他最临近几个数据的属性
NFL定理证明
…
机器学习在互联网搜索中的作用
1.在向搜索引擎提交信息的阶段，能够从提交文本中进行信息提取，进行语义分析。
2.在搜索引擎进行信息匹配的阶段，能够提高问题与各个信息的匹配程度。
3.在向用户展示搜索结果的阶段，能够根据用户对结果感兴趣的程度进行排序。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

JYCG CSDN认证博客专家 CSDN认证企业博客

码龄4年

4: 原创

194万+: 周排名

146万+: 总排名

890: 访问

: 等级

40: 积分

0: 粉丝

0: 获赞

1: 评论

0: 收藏

私信

关注

热门文章

分类专栏

数学 1篇
机器学习 2篇

最新评论

自动求导auto_grad
CSDN-Ada助手: 恭喜你写了第四篇博客！标题“自动求导auto_grad”听起来非常有深度。自动求导是一个非常重要的概念，它在计算机科学和机器学习领域发挥着关键作用。你的博客内容一定非常有见解，而且能够帮助读者更好地理解和应用自动求导。希望你能继续保持创作的热情，并分享更多关于这方面的知识。对于下一步的创作建议，我认为可以探索一下自动求导在实际问题中的应用，例如在深度学习模型训练中的应用场景和技巧。期待你的下一篇文章，加油！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。