自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

转载 机器学习-k-means

K-means算法简介K-means算法也被称为K-平均或K-均值,是一种得到最广泛使用的聚类算法。它是将各个聚类子集中的所有数据样本的均值作为该聚类的代表点,算法的主要思想是通过迭代过程把数据集划分为不同的类别,使得评价聚类性能的准则函数达到最优,从而是生成的每个聚类内部紧凑,类间独立。K-means聚类是属于无监督学习的,以往的回归、朴素贝叶斯、SVM等都是有类别数值标签Y的...

2013-05-18 17:13:00 142

转载 机器学习-朴素贝叶斯

贝叶斯定理朴素贝叶斯定理主要是在已知某条件概率的前提下,如何得到两个事件交换后的概率,也就是在已知P(A/B)的情况下如何求得P(B/A).贝叶斯定理之所以那么有用,是因为我们在生活中经常遇到这种情况:我们可以很容易的直接得到P(A/B),P(B/A)则很难直接得出,而我们更关心的是后者。贝叶斯就为我们解决了该问题,打通从P(A/B)到P(B/A)的道路,下面给出贝叶斯定理:...

2013-05-17 16:29:00 163

转载 LSA(LSI)算法简介

前言在信息检索领域常用的检索和索引算法有空间向量模型和隐语义模型。传统向量空间模型向量空间模型是信息检索领域最常用的检索方法,其检索过程是,将文档集D中的所有文档和查询都表示成以单词为特征的向量,特征值为每个单词的TF-IDF值,然后使用向量空间模型(即计算查询Q的向量和每个文档的之间的相似度)来衡量文档和查询之间的相似度,从而得到和给定查询最相关的文档。缺点向量空间...

2013-04-21 20:05:00 1102

转载 基于内容的推荐简介

系统简介基于内容的推荐系统(也称CB):根据用户历史信息(如评分、评价、分享、和收藏过的文档)构造用户偏好文档,计算推荐项目与用户偏好文档的相似度,将最相似的项目推荐给用户。例如,在书籍推荐中,基于内容的系统首先分析用户已经购买过的打分比较高的书籍的共性(作者、风格等),再推荐与这些用户感兴趣的书籍内容相似度高的其他电影。再例如一个推荐饭店的系统可以依据某个用户之前喜欢很多的烤肉店而...

2013-04-16 14:58:00 588

转载 Item-based collaborative filtering

CF算法分为两大类,一类为基于memory的(Memory-based),另一类为基于Model的(Model-based),User-based和Item-based算法均属于Memory-based类型,具体的User-based的内容请参见我的前一篇博文,下面主要介绍Item-based算法Item-based算法主要分为两步:即item similarity computat...

2013-04-15 21:56:00 192

转载 基于用户的协同过滤算法简介

基本思想:根据用户对物品的评分向量之间的相似性,搜索目标用户的最近邻居,然后根据最近邻居的评分向目标用户产生推荐。基本步骤:主要分为三步:建立用户模型、寻找最近邻居和产生推荐物品。建立用户模型:协同过滤算法的输入数据通常表示为一个m*n的用户—评价矩阵R,m用户数,其中Rij其中Rij表示第i个用户对第j个物品的评分值:这里的评分值可以是用户的浏览次数,...

2013-04-15 17:40:00 835

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除