Cart文本分类算法原理和例子

最新推荐文章于 2020-11-08 16:52:01 发布

ExtraMan

最新推荐文章于 2020-11-08 16:52:01 发布

阅读量3.7k

点赞数

分类专栏：数据挖掘文章标签： cart算法文本分类数据挖掘入门

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/extraman/article/details/41744003

版权

本文介绍了Cart算法的基本原理，通过Gini系数评估节点的纯度，并使用此标准选择最佳属性进行划分。文章详细展示了如何计算属性的差异性损失，以及如何处理数值型属性。通过一个具体的例子，解释了如何构建Cart决策树，最终得出分类结果。

摘要由CSDN通过智能技术生成

ID3使用信息增益作为属性选择标准，c4.5使用信息增益率作为属性选择标准。Cart算法使用GIni系数来度量对某个属性变量测试输出的狼族取值的差异性，理想的分组应该尽量使两组中样本输出变量的差异性总和达到最小，即“纯度”最大，也就是是两组输出变量取值的差异性下降最快，“纯度”增加最快。

设t为分类回归树中的某个节点，称函数

为Gini系数，k为当前属性下测试输出的类别数，p(j|t)为节点t中样本测试输出取类别j的概率。对节点t而言，G(t)越小，意味着该节点中所包含的样本越集中在某一类上，即该节点越纯，否则说明越不纯，差异性就越大。当节点样本的测试输出均取同一类别值时，输出变量取值的差异性最小，Gini系数为0，而当各类别取概率值相等时，测试输出取值的差异性最大，GIni系数也最大，为1-（1/k），其中k为目标变量的类别数。

设t为一个节点，§为该节点的一个属性分枝条件，该分支条件将该节点t中样本分别到左分支Sl和右分支Sr中，则称

为在分支条件下节点t的差异性损失，其中，G(t)为划分前测试输出的GIni系数，|Sr|和|Sl|分辨表示划分后的左右分支的样本个数。为了使节点t尽可能的纯，我们需要选择某个属性分支条件，使该节点的差异性宣誓尽可能大。

最低0.47元/天解锁文章

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

ExtraMan CSDN认证博客专家 CSDN认证企业博客

码龄12年

24: 原创

26万+: 周排名

202万+: 总排名

5万+: 访问

: 等级

762: 积分

9: 粉丝

10: 获赞

8: 评论

71: 收藏

私信

关注

热门文章

分类专栏

最新评论

缓存和数据库的最终一致性方案
CSDN-Ada助手: 不知道云原生入门技能树是否可以帮到你：https://edu.csdn.net/skill/cloud_native?utm_source=AI_act_cloud_native
分享一个双目测距的项目
Chanyelo__: 你好，可以请教下双目测距相关么，qq2271805411
分享一个双目测距的项目
biptirb 回复 TaecyeonForever: 你好，我也是结果差好多，请问你最后解决了么？
分享一个双目测距的项目
dududu1207 回复 qq_37686403: 你好，想跟你讨论双目测距的问题。可否加qq1216567980
分享一个双目测距的项目
qq_37686403: 大大神好！我是一个新手，最近在弄关于双目测距的毕业设计，我的设计就是只有用双目拍摄一组图片，然后可以离线点击点云图获取其中某点的距离。我已经完成了标定，校准，匹配等任务，现在不知道该怎么获取视差图以及点云图。我的编程很渣，还望耐心指教，不胜感激。程序最后是这样的： IplImage *Left_Rectify_Img = cvLoadImage("A-Images\\Rectified Images\\Rectified Left Image.bmp", 0); IplImage *Right_Rectify_Img = cvLoadImage("A-Images\\Rectified Images\\Rectified Right Image.bmp", 0); CvStereoGCState *GCState = cvCreateStereoGCState(16, 50); // Parameters of numberOfDisparities and maxlters assert(GCState); CvMat *GCDispLeft = cvCreateMat(Left_Rectify_Img->height,Left_Rectify_Img->width,CV_16S); CvMat *GCDispRight = cvCreateMat(Right_Rectify_Img->height, Right_Rectify_Img->width, CV_16S); CvMat *GCDisp = cvCreateMat(Left_Rectify_Img->height, Left_Rectify_Img->width, CV_8U); cvFindStereoCorrespondenceGC(Left_Rectify_Img, Right_Rectify_Img, GCDispLeft, GCDispRight, GCState); cvNormalize(GCDispRight, GCDisp, 0, 255, CV_MINMAX); cvSaveIma("A-Images\\RectifiedImages\\StereoMatch.bmp", GCDisp);

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。