《机器学习实战》中的splitDataSet函数

最新推荐文章于 2022-04-06 10:01:24 发布

weixin_33708432

最新推荐文章于 2022-04-06 10:01:24 发布

阅读量3.1k

点赞数

文章标签： python 人工智能数据结构与算法

splitDataSet这个函数困扰了我好一阵子，为什么以某一特征值为标准进行划分数据集以后，变成了局部？例如，如果以第1个特征为0为标准进行划分，那么返回的结果集就是不含有此特征的结果集，如下图红框部分所示：

代码表示为：[[1, 'no'], [1, 'no']]

同理，如果以第1个特征为1作为标准，那么返回的结果集如下图所示：

代码表示为：[[1, 'yes'], [1, 'yes'], [0, 'no']]

后经此文提示：http://blog.csdn.net/guo1988kui/article/details/75110361

了解到这是因为把那个特征值作为分界线以后，它自身不再作为特征出现在数据集中。

但是我没想明白为什么要这样做，是什么道理？为什么分界线就不再进入数据集了？穿红衣服的同学一组，蓝衣服的同学一组，那么这个分界线就是“衣服”，为什么要把“衣服”排除在外？

同时，实际上，它是否进入数据集，对熵并没有影响。

它统计的是符合特征的样本数量占样本总体的比例，得到概率，与特征数量本身没有关系。

存疑。随着学习的深入，希望有一天能够解开。

继续往下看就知道了，因为要构建决策树，数据集中的特征应当逐步减少。

weixin_33708432

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
《机器学习实战》中的splitDataSet函数

splitDataSet这个函数困扰了我好一阵子，为什么以某一特征值为标准进行划分数据集以后，变成了局部？例如，如果以第1个特征为0为标准进行划分，那么返回的结果集就是不含有此特征的结果集，如下图红框部分所示：代码表示为：[[1, 'no'], [1, 'no']] 同理，如果以第1个特征为1作为标准，那么返回的结果集如下图所示：代码表示为：[[1, 'yes'], ...
复制链接

扫一扫

weixin_33708432 CSDN认证博客专家 CSDN认证企业博客

码龄9年

141: 原创

-: 周排名

120万+: 总排名

120万+: 访问

: 等级

7116: 积分

5471: 粉丝

251: 获赞

14: 评论

1313: 收藏

私信

关注

热门文章

最新评论

Mac安装scrapy并创建项目
weixin_50137714: bogon:~ chenjiaxin$ pip3 --version pip 9.0.1 from /Library/Frameworks/Python.framework/Versions/3.5/lib/python3.5/site-packages (python 3.5) bogon:~ chenjiaxin$ pip3 install Scrapy Collecting Scrapy Could not fetch URL https://pypi.python.org/simple/scrapy/: There was a problem confirming the ssl certificate: [SSL: TLSV1_ALERT_PROTOCOL_VERSION] tlsv1 alert protocol version (_ssl.c:720) - skipping Could not find a version that satisfies the requirement Scrapy (from versions: ) No matching distribution found for Scrapy bogon:~ chenjiaxin$ scrapy -bash: scrapy: command not found 你好我想咨询下为什么我想查看版本号的时候出现了not found. 小白中的小白，请手下留情
扫地机器人的模拟程序 (1)
m0_64605326: 你好，可以联系你吗？我们要开发机器人扫地机，我们可以合作，我联系电话13996744426张先生
在VS2013中查看C/C++预处理后的文件
Tisfy: 写文章不易，继续加油
【C语言】二维指针做形参
Avon_special: 太感谢了，查了半天终于找到有用的了
WPF学习笔记：（一）数据绑定与DataContext
sas2022: 学到了，学到了，谢谢

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。