- 博客(4)
- 资源 (2)
- 收藏
- 关注
原创 [_数据挖掘_] 决策树实现
参考"collective intelligence“相关章节的实现。 决策树使用广泛,对于理解内在的推理过程非常有帮助,非常适合那些属性是类别值的,或者数字属性有breakpoint的应用场景。但是缺点是不适合输出较多,元组的类别由多个属性的复杂组合决定的情况(比如说输出由两个属性的差值来决定)。 决策树由自上而下的递归算法来实现。下面是书中的实现的伪码,和经典的算法稍微有些差别,毕竟这是正
2009-11-22 15:24:00 258 1
原创 [_数据挖掘_] SVM学习
SVM也许是最近开始被人们关注的一种较有前途的分类方法。准确地说是一种算法,一般有以下两个步骤: 1)将数据映射到较高的维; 2)在新的空间搜索线性最佳分离超平面。 对于在原有空间就线性可分的数据不需要进行非线性映射,否则就需要映射到较高的维之后进行分类。因为SVM可以对复杂的非线性决策边界的建模能力是高度准确的,并且和其他的模型相比,不太容易会出现过分拟合的情况,所以被应用到许多的领域,比
2009-11-21 10:29:00 2083
原创 [_数据挖掘_] 决策树
分类是数据挖掘的一个非常重要的主题,现实中的很多问题都和分类密切相关。我们日常正是因为有了分类技巧,才能对不同的事物、场景采取不同的应对方式。 数据分类可以看做是一个两步的过程。第一步是学习过程,我们根据所需要分析的问题和数据建立一个分类器classifier。用我们选择好的训练元组对分类器进行训练,如果训练元组中已经包含了各样本的类标识号,也就是说知道了样本的类别,则称为监督学习,否
2009-11-15 23:35:00 1640
原创 [_数据挖掘_] python实践之1
计划这个星期学习用python实现决策树算法。今晚就碰到了好多问题,好久没有用python了,并且3.0和书本上的有些东西不太一致,这里记录下几个地方。1) import module 如果不是在标准目录下(系统的path,python的目录,当前目录),那么需要先import sys,然后sys.path.append();2) 改变源文件后,再次import发现不起作用;del后
2009-11-05 23:08:00 760
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人