机器学习实战（代码部分）-- 决策树（Ⅱ 按照给定特征划分数据集）

最新推荐文章于 2022-06-02 14:49:10 发布

m0_38056893

最新推荐文章于 2022-06-02 14:49:10 发布

阅读量1k

点赞数 5

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_38056893/article/details/102876095

版权

本文深入探讨了如何按照给定特征划分数据集，特别是在决策树算法中的应用。介绍了splitDataSet函数，该函数用于从数据集中选择特定特征值的子集，并给出了详细的操作示例，阐述了如何计算信息增益并使用该函数处理数据。

摘要由CSDN通过智能技术生成

3-2 按照给定特征划分数据集

若subDataSet = splitDataSet(dataSet, axis, value)，则dataSet[axis] == value的概率为prob = len(subDataSet) / float(len(dataSet))。则之后可以通过计算prob * 香农熵(dataSet[axis] == value)计算信息增益。

关于信息增益的计算案例参考：机器学习 -- 决策树（Ⅴ决策树构造实例）

【案例】若有如下数据：则splitDataSet(dataSet, axis, value)表示取出第axis列中值为value的数据集，并去除掉第axis列的数据。

splitDataSet(dataSet, 0, 0)表示在dataSet中取出第0列数值为0的数据集，再去除掉0这一列。如[0, 1, 0, 1, 'no']则变为[1, 0, 1, 'no']，[0, 1, 1, 1, 'yes']变为[1, 1, 1, 'yes']。具体情况如下图：dataSet为原始数据集，retDataSet为进行splitDataSet(dataSet, 0, 0)后得到的数据集。

划分数据集的函数实现：

最低0.47元/天解锁文章

关注

5
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

m0_38056893 CSDN认证博客专家 CSDN认证企业博客

码龄8年

340: 原创

17万+: 周排名

192万+: 总排名

83万+: 访问

: 等级

8708: 积分

190: 粉丝

573: 获赞

124: 评论

1856: 收藏

私信

关注

热门文章

分类专栏

最新评论

python安装win32com模块
2301_78033218: pip install pypiwin32
python安装win32com模块
快乐的学习才能享受工作的过程: 想给你点赞，但我不理解，为什么正确的命令放图片里面，文字里面放一个错误的命令，搞不清楚您到底想不想帮助大家解决问题
python安装win32com模块
怠惰的金枪小鱼干: 用这个 pip install pywin32
LogParser的安装
不会就得多练: 软件安装包有吗，给个链接
归并排序（Java代码实现）
阿森的经验宝箱: 优化了一下Java的规范： [code=java] public void mergeSort(int[] arr, int left, int right) { if (left < right) { int mid = (left + right) / 2; mergeSort(arr, left, mid); mergeSort(arr, mid + 1, right); merge(arr, left, mid, right); } } public void merge(int[] arr, int left, int mid, int right) { int[] tmp = new int[right - left + 1]; int k = 0; int i = left, j = mid + 1; while (i <= mid && j <= right) { if (arr[i] < arr[j]) tmp[k++] = arr[i++]; else tmp[k++] = arr[j++]; } while (i <= mid) tmp[k++] = arr[i++]; while (j <= right) tmp[k++] = arr[j++]; for (int t = 0; t < k; t++) { arr[left + t] = tmp[t]; } } [/code]

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。