python
文章平均质量分 90
chuhang_zhqr
这个作者很懒,什么都没留下…
展开
-
机器学习实战3--决策树
K近邻可以完成很多分类任务,但其无法给出数据的内在含义。 这次来阐述下决策树的原理及python实现,另有实例剖析。 决策树可以使用不熟悉的数据集合,从中提取一系列规则。原理:在构造决策树时,需要找到当前数据集上哪个特征在划分数据分类时起决定作用。为了找到决定性的特征,划分出最好的结果,我们必须评估每个特征。找到最好的划分特征时,完成第一次分类,数据集被划分成几个数据子集,这些数据子集会分布在第原创 2016-02-24 15:58:30 · 2905 阅读 · 0 评论 -
机器学习实战2--K近邻
本博客基于机器学习实战这本书,主要是对机器学习的算法原理及python实现进行详细解释,若是有些没有阐述清楚的,看到的请指出。 第二章的K近邻算法是一个简单的机器学习算法。 K近邻算法: 原理:收集一个样本数据集合,并且样本集中每个数据都存在标签。输入没有标签的新数据后,将新数据的每个特征与样本集中数据对应的特征进行比较,然后算法提取样本集中特征最相似数据(最近邻)的分类标签。选择样本数据集中原创 2016-02-23 16:29:06 · 1361 阅读 · 0 评论 -
机器学习实战4--朴素贝叶斯
分类器在进行分类的时候会给出一个最优的类别猜测结果,同时给出这个猜测的概率估计值。若p1>p2,那么属于类别1,反之属于类别2。 朴素贝叶斯属于贝叶斯决策理论的一部分:贝叶斯准则是计算条件概率的方法,若已知P(x|c),要求P(c|x),则p(c|x)=p(x|c)p(c)/p(x)。 p(c1|x,y)表示给定某个由x,y表示的数据点,那么该数据点来自c1的概率是多少。利用贝叶斯准则求得p(x原创 2016-02-27 15:07:46 · 2744 阅读 · 0 评论 -
机器学习实战5--Logistic回归
前面的分类都是基于标签是离散值进行的,这里回归是针对标签是连续值进行的。 假设现在有一些数据点,我们用一条直线对这些点进行拟合,这个拟合过程就是回归,该线就是最佳拟合直线。主要思想:根据现有数据对分类边界线建立回归公式,以此进行分类。回归就是最佳拟合,找到最佳拟合参数集,训练分类器的做法就是寻找最佳拟合参数,使用的是最优化算法。 找到分类回归系数就可以了。 1:基于logistic回归和Sig原创 2016-02-29 14:30:06 · 1005 阅读 · 0 评论