自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

zcy19941015的博客

一个苦逼准码农

  • 博客(5)
  • 问答 (1)
  • 收藏
  • 关注

原创 3、决策树

决策树主要包括ID3、C4.5、CART三种主要的算法。这三种算法的思想是一致的,都是选择一个属性,对特征空间逐步细分,最后再剪枝。这三步用书上的原话说就是:特征选择,决策树的生成和剪枝。 1、特征选择 信息增益相当于“用这个特征分类”和“数据集本身混乱度”之间的互信息。我们倾向于选择能提供更大互信息的特征,这样意味着用该特征分类更有价值。 在ID3算法中,特征选择是使用了信息增益最

2015-07-29 10:20:10 675 2

原创 2、朴素贝叶斯法

看了李航的《统计学习方法》中的第四章:朴素贝叶斯法,我的几点思考如下: 1、关于连续模型 如果模型的输入空间是连续的,那么是先量化再用离散模型做,还是直接使用连续模型拟合呢? 这一点还应该再看看书。 2、关于条件独立性假设 这个假设是很强的一个假设,直接导致了朴素贝叶斯法无法使用到一般问题中。一般问题都不满足条件独立性。 我认为可以先用KLT处理数据,去除相关性和噪声,再来处理。 3

2015-07-25 15:46:39 329

转载 sort、sorted、lambda表达式和reduce

原文:http://www.cnblogs.com/65702708/archive/2010/09/14/1826362.html http://blog.csdn.net/imzoer/article/details/8667176 http://blog.sina.com.cn/s/blog_7b519a6b0101bntx.html 1、sort和sorted 我们需要对L

2015-07-25 10:24:13 11544

原创 1、k-邻近算法

1、首先要搭建环境 这里需要numpy、scipy、matplotlib三个库,下载地址如下,双击安装即可: (需要注意python的版本号和32/64位) numpy:http://sourceforge.net/projects/numpy/files/NumPy/1.7.0/ matplotlab:http://sourceforge.net/projects/matplotlib/

2015-07-24 19:56:12 467

转载 4、Django基本数据操作

(一)导入项目的环境设置 1、在cmd窗口中操作的初始化方法 python manage.py shell 2、在idle中进行数据操作需要的环境初始化操作 import os; import sys; sys.path.append("E:\\tmp\\mysite");   # 项目位置 os.environ.setdefault("DJANGO_SETTINGS_MOD

2015-07-04 10:56:04 376

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除