自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 pagerank算法解析

在看到项亮的《推荐系统实战》一书中,接触到了基于图的模型的推荐算法中涉及到的pagerank算法,索性就整理了一下关于这个算法的一些资料。一、原理   Pagerank可以简单的说就是模拟一个悠闲的上网者,以不同的概率打开不同的网页的问题,当然这里会涉及到打开的是同一个网页以及不能打开所有网页的问题,这个问题会在后面具体介绍。二、pagerank模型计算过程上图是一个强

2017-03-04 17:50:29 470

原创 推荐系统(二)协同过滤

今天我们来看看推荐算法中最常见的协调过滤,并且把UserCF和ItemCF放在一起比较,基于用户的协同过滤算法就是推荐和他相似的用户的喜欢的物品,基于物品的协同过滤算法就是推荐他之前喜欢的物品相似的物品。这两种都可以算是基于领域的算法,简单的来说,一种是找到相似用户,一种是相似物品。(一)  首先来说下相似度的计算我们一般用余弦相似度计算1.      基于用户的相似度计算:Wuv

2017-02-19 17:56:23 413

原创 推荐系统(一)评测指标

一、什么是好的推荐系统对推荐系统的评价和单纯的算法的评价略有不同,评价一个推荐系统的好坏可以从多个角度去评价。1.      推荐系统的实验方法首先我们先来介绍下获得这些指标的实验方法,主要有离线实验、用户调查、在线实验。离线实验的数据主要从数据集上完成,不需要从一个实际的系统来获取实验,只要提供系统日记即可,缺点是无法获取商业上的指标,并且离线实验和商业指标上存在差距。用户调

2017-02-18 21:05:14 887

原创 专题数据分析小结与体会

今天公司做了下关于专题数据分析的培训,恰巧最近在做一个关于和教育的数据分析,还有就是今天听培训的时候拿了一个不知道从什么时候带到公司的草稿本(已经没有可以写的地方了==)做的笔记,恐怕只有自己才看的懂了,所以就想记录下来,巩固下培训的内容,因为人的瞬时记忆是有限的,最好的记忆方法就是晚上回顾当天的知识点,形成自己的知识体系。好了说了这么多,开始进入正题了。明确业务问题——议题——子议题——分析

2017-02-16 22:07:39 581

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除