2015年07月_路人甲wttttt

11月 09月 08月 07月 06月 05月

原创 3、决策树

决策树主要包括ID3、C4.5、CART三种主要的算法。这三种算法的思想是一致的，都是选择一个属性，对特征空间逐步细分，最后再剪枝。这三步用书上的原话说就是：特征选择，决策树的生成和剪枝。 1、特征选择信息增益相当于“用这个特征分类”和“数据集本身混乱度”之间的互信息。我们倾向于选择能提供更大互信息的特征，这样意味着用该特征分类更有价值。在ID3算法中，特征选择是使用了信息增益最

2015-07-29 10:20:10 675 2

原创 2、朴素贝叶斯法

看了李航的《统计学习方法》中的第四章：朴素贝叶斯法，我的几点思考如下： 1、关于连续模型如果模型的输入空间是连续的，那么是先量化再用离散模型做，还是直接使用连续模型拟合呢？这一点还应该再看看书。 2、关于条件独立性假设这个假设是很强的一个假设，直接导致了朴素贝叶斯法无法使用到一般问题中。一般问题都不满足条件独立性。我认为可以先用KLT处理数据，去除相关性和噪声，再来处理。 3

2015-07-25 15:46:39 329

转载 sort、sorted、lambda表达式和reduce

原文：http://www.cnblogs.com/65702708/archive/2010/09/14/1826362.html http://blog.csdn.net/imzoer/article/details/8667176 http://blog.sina.com.cn/s/blog_7b519a6b0101bntx.html 1、sort和sorted 我们需要对L

2015-07-25 10:24:13 11544

原创 1、k-邻近算法

1、首先要搭建环境这里需要numpy、scipy、matplotlib三个库，下载地址如下，双击安装即可：（需要注意python的版本号和32/64位） numpy：http://sourceforge.net/projects/numpy/files/NumPy/1.7.0/ matplotlab：http://sourceforge.net/projects/matplotlib/

2015-07-24 19:56:12 467

转载 4、Django基本数据操作

（一）导入项目的环境设置 1、在cmd窗口中操作的初始化方法 python manage.py shell 2、在idle中进行数据操作需要的环境初始化操作 import os; import sys; sys.path.append("E:\\tmp\\mysite"); # 项目位置 os.environ.setdefault("DJANGO_SETTINGS_MOD

2015-07-04 10:56:04 376

空空如也

python中的xpath，为什么'/html'就匹配不到

2015-10-11

TA创建的收藏夹 TA关注的收藏夹

TA关注的人