机器学习
文章平均质量分 77
wangyuquan
这个作者很懒,什么都没留下…
展开
-
感知机分类学习
感知机(perceptron)是一种二类分类的线性分类模型,也就是说,使用于将数据分成两类的,并且数据要线性可分。线性可分是指存在一个超平面能够将空间分成两部分,每一部分为一类,感知机的目的就在于找这样的一个超平面。假设输入数据形式为x = (x1,x2....xn),即所谓的特征向量。y代表输入数据的类别,为{+1,-1},感知机的形式为f(x) = sign(w*x+b),当w*x+b>=原创 2013-11-26 22:59:49 · 5433 阅读 · 0 评论 -
推荐系统的评测方法及指标
首先声明,以下内容是看了项亮的《推荐系统实践》后 写的,内容基本出自该书,只是我自己再归纳总结一下而已(以免喷子又喷)推荐系统中,主要有三种评测推荐效果的实验方法:1)离线实验。 往往是从日志系统中取得用户的行为数据,然后将数据集分成训练数据和测试数据,比如80%的训练数据和20%的测试数据(还可以交叉验证),然后在训练数据集上训练用户的兴趣模型,在测试集上进行测试。 优点:只需要原创 2014-07-03 19:53:54 · 17742 阅读 · 0 评论 -
SVD在推荐系统中的应用与实现(c++)
主要参考论文《A Guide to Singular Value Decomp osition for Collab orative Filtering》其实一开始是比较疑惑的,因为一开始没有查看论文,只是网上搜了一下svd的概念和用法,搜到的很多都是如下的公式:其中假设C是m*n的话,那么可以得到三个分解后的矩阵,分别为m*r,r*r,r*n,这样的话就可以大大降低存储代价,但是这里特别需要原创 2015-02-16 11:49:19 · 8828 阅读 · 11 评论 -
朴素贝叶斯实现垃圾邮件分类------matlab实现
之所以用matleb实现,是因为这是数据挖掘课的几个大作业之一,作业要求,不然也不会这么蛋疼用matlab....(因为我不会matlab...)朴素贝叶斯原理非常简单,最重要的就是概率公式:其余的内容介绍可以参考:http://zh.wikipedia.org/wiki/%E6%9C%B4%E7%B4%A0%E8%B4%9D%E5%8F%B6%E6%96%AF%E5%88%8原创 2013-11-30 22:55:24 · 10673 阅读 · 10 评论