算法
youngAntitheist
这个作者很懒,什么都没留下…
展开
-
决策树剪枝简单python实现
决策树是一种依托决策而建立起来的一种树。在机器学习中,决策树是一种预测模型,代表的是一种对象属性与对象值之间的一种映射关系,每一个节点代表某个对象,树中的每一个分叉路径代表某个可能的属性值,而每一个叶子节点则对应从根节点到该叶子节点所经历的路径所表示的对象的值。决策树仅有单一输出,如果有多个输出,可以分别建立独立的决策树以处理不同的输出。ID3算法:ID3算法是决策树的一种,是基于奥卡姆剃刀原...原创 2017-12-18 16:52:31 · 8659 阅读 · 5 评论 -
Kmeans算法 python实现
K-Means算法简介:事先确定常数K,常数K意味着最终的聚类类别数,首先随机选定初始点为质心,并通过计算每一个样本与质心之间的相似度(这里为欧式距离),将样本点归到最相似的类中,接着,重新计算每个类的质心(即为类中心),重复这样的过程,知道质心不再改变,最终就确定了每个样本所属的类别以及每个类的质心。 总的来说,算法很简单,下面是python的简单实现:import numpy as np...原创 2018-03-26 21:27:13 · 421 阅读 · 0 评论 -
isomap算法 python实现
isomap算法主要流程:1:构建邻接图G:基于输入空间X中流形G上的的邻近点对i,j之间的欧式距离dx (i,j),选取每个样本点距离最近的K个点(K-Isomap)或在样本点选定半径为常数ε的圆内所有点为该样本点的近邻点,将这些邻近点用边连接,将流形G构建为一个反映邻近关系的带权流通图G;2:计算所有点对之间的最短路径:通过计算邻接图G上任意两点之间的最短路径逼近流形上的测地距离...原创 2018-03-26 21:34:07 · 7487 阅读 · 3 评论 -
Adaboost 算法实现
Adaboost简介:Adaboost是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器(弱分类器),然后把这些弱分类器集合起来,构成一个更强的最终分类器(强分类器)。下面使用sklearn库简单体验一下,使用自带数据集iris:from sklearn.model_selection import cross_val_scorefrom sklearn.data...原创 2018-03-26 21:41:44 · 320 阅读 · 0 评论 -
Python实现根据评论评分信息预测 (协同过滤,LFM,词向量)
一.数据集train.dat共393366项,第一维是用户的代号,第二维是商品代号,第三项是用户对该商品的评分,第四项是评论数,第五项是评论内容。 test.dat第一维是用户代号,第二维是商品代号。 二.简单思路及实现过程这里简单先贴出代码实现,后期再慢慢补上具体过程说明~1.数据预处理去除部分无关常用词,这里调用nltk包,将评论词词词根化等,进行...原创 2018-06-28 01:17:54 · 4842 阅读 · 4 评论