机器学习和数据挖掘相关算法
tanyanzimo
这个作者很懒,什么都没留下…
展开
-
3.决策树Decision Tree
1.思想简介http://www.cnblogs.com/leoo2sk/archive/2010/09/19/decision-tree.html#32333022.评价优点1)决策树易于理解和实现,人们在在学习过程中不需要使用者了解很多的背景知识,这同时是它的能够直接体现数据的特点,只要通过解释后都有能力去理解决策树所表达的意义。2)对于决策树,数据的准原创 2015-07-27 14:00:43 · 487 阅读 · 0 评论 -
梯度下降(Gradient Descent)
1.基本思想简介http://www.cnblogs.com/LeftNotEasy/archive/2010/12/05/mathmatic_in_machine_learning_1_regression_and_gradient_descent.html2.一个简例一个通过迭代求解convex function最小值的方法: Gradient descent(转载 2015-08-18 10:56:25 · 346 阅读 · 0 评论 -
PCA主成分分析
1.PCA的公式推导http://www.doc88.com/p-9465493251834.html2.相关原理解释http://blog.codinglabs.org/articles/pca-tutorial.html3.应用和代码实例(python)http://blog.csdn.net/moodytong/article/details/10084243原创 2015-07-24 17:18:08 · 271 阅读 · 0 评论 -
k最近邻算法(KNN)的简介和python实现
一、算法要点1、指导思想kNN算法的指导思想是“近朱者赤,近墨者黑”,由你的邻居来推断出你的类别。如果一个样本在特征空间中的k个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性。该方法在确定分类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。 kNN方法在类别决策时,只与极少量的相邻样本有关。由于kNN方法主要靠周围有限的邻近转载 2015-08-02 15:32:16 · 597 阅读 · 0 评论 -
用PersonalRank实现基于图的推荐算法(python实现)
http://blog.csdn.net/harryhuang1990/article/details/10048383转载 2015-08-02 14:18:43 · 804 阅读 · 0 评论 -
LFM(Latent factor model)隐语义模型的思想和伪代码
http://blog.csdn.net/harryhuang1990/article/details/9924377转载 2015-08-02 14:16:25 · 1520 阅读 · 0 评论 -
UBCF和IBCF的python实现和比较
http://my.oschina.net/zhangjiawen/blog/185625原创 2015-08-01 15:08:09 · 4217 阅读 · 0 评论 -
基于物品的协同过滤算法和SlopeOne的python实现
http://blog.csdn.net/zhu418766417/article/details/45098773转载 2015-08-01 19:33:37 · 498 阅读 · 0 评论 -
5.基于记忆的推荐算法(memory-based model)
http://m.blog.csdn.net/blog/kevin7658/23744641转载 2015-07-31 09:59:43 · 1355 阅读 · 0 评论 -
各种分布及应用场合(建模对象)
http://www.360doc.com/content/14/0110/18/15459877_344179498.shtml转载 2015-07-30 13:49:45 · 392 阅读 · 0 评论 -
2.朴素贝叶斯Naive Bayes
1.思想简介和实例http://www.cnblogs.com/leoo2sk/archive/2010/09/17/naive-bayesian-classifier.html2.适用情况和评价朴素贝叶斯分类器(NBC)基于一个简单的假定:给定目标值时属性之间相互条件独立。所需估计的参数很少,对缺失数据不太敏感,算法也比较简单。理论上,NBC模型与其他分类方法原创 2015-07-27 13:30:51 · 475 阅读 · 0 评论 -
机器学习的概率与统计知识复习总结
http://blog.csdn.net/viewcode/article/details/8819361转载 2015-07-30 14:07:55 · 337 阅读 · 0 评论 -
LDA主题模型
1、核心思想先定义一些字母的含义:文档集合D,topic集合TD中每个文档d看作一个单词序列,wi表示第i个单词,设d有n个单词。(LDA里面称之为word bag,实际上每个单词的出现位置对LDA算法无影响)D中涉及的所有不同单词组成一个大集合VOCABULARY(简称VOC)LDA以文档集合D作为输入(会有切词,去停用词,取词干等常见的预处理,略去不表),希望训练出的两转载 2015-08-09 13:33:38 · 1151 阅读 · 0 评论 -
4.k均值聚类(K-means)
1.思想简介与实例K-means算法是硬聚类算法,是典型的基于原型的目标函数聚类方法的代表,它是数据点到原型的某种距离作为优化的目标函数,利用函数求极值的方法得到迭代运算的调整规则。K-means算法以欧式距离作为相似度测度,它是求对应某一初始聚类中心向量V最优分类,使得评价指标J最小。算法采用误差平方和准则函数作为聚类准则函数。 k均值算法的计算过程非常直观:原创 2015-07-27 14:48:56 · 1011 阅读 · 0 评论 -
SVM支持向量机
http://www.csdn.net/article/2012-12-28/2813275-Support-Vector-Machine转载 2015-08-03 10:27:04 · 306 阅读 · 0 评论