自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

linger(心怀梦想,活在当下,知乎ID:linger liu)

互联网的小码农(数据挖掘,推荐系统,广告系统)

  • 博客(8)
  • 资源 (4)
  • 收藏
  • 关注

原创 层次分析法量化用户的产品偏好

层次分析法量化用户的产品偏好              用户对产品有很多行为,如何进行用户行为分析来量化用户对产品的喜好程度呢?              比如豆瓣FM,用户可以点击“喜好”和"扔进垃圾箱"等;比如优酷视频,用户可以顶,踩,分享等。              我们如何通过这些行为信息分析用户对这首歌的喜好程度,对这个视频的评分是多少。

2014-12-19 01:03:15 7700 1

原创 CSDN2014博客之星评选(求投票支持)

CSDN2014博客之星评选(求投票支持)http://vote.blog.csdn.net/blogstar2014/details?username=linger2012liu#content大家好,2014年CSDN博客之星评选开始了。如果我的博客对您有所帮忙,还望您百忙之中抽空投我一票,非常您一直以来的支持和鼓励。投票网址:http://vote.blog.csdn.net/blogstar2014/details?username=linger2012liu#content

2014-12-31 23:21:03 2174 1

原创 Mongodb杂谈(一)

Mongodb杂谈(一)开始学习mongodb时,找一些中文博客看。后来发现很多知识都搜不到,最后还是看官方网站和权威指南,还是这两者靠谱,闲的时候可以多浏览一下。此文总结一下我入门学习mongodb的经验。  Mongo shell操作mongodb 安装完mongodb客户端后,通过shelll来操作mongodb。我是在Ubuntu使用客户端的,直接用ap

2014-12-26 23:29:32 1790

原创 maven打包hadoop项目(含第三方jar)

maven打包hadoop项目(含第三方jar) 问题背景:1 写map-reduce程序,用到第三方jar,怎么打包并提交项目到服务器执行。2 mahout中itembased算法,将uid从string映射为long。 我这里实现的具体功能是:Mahout的itembased算法的数据格式是:uid,vid,score。其中uid和vid必须是数字型(long),s

2014-12-25 00:12:46 6551 1

原创 mahout入门指南之基于mahout的itembased算法

基于mahout的itembased算法 其实mahout分布式上只是实现了部分算法。比如推荐算法中Item-based和slopone都有hadoop实现和单机版实现,User-based没有分布式实现。 Mahout已实现的算法(单机版和分布式版)https://mahout.apache.org/users/basics/algorithms.html  大多

2014-12-22 23:20:44 3214

原创 Hive自定义函数UDAF开发

Hive自定义函数UDAF开发Hive支持自定义函数,UDAF是接受多行,输出一行。通常是group by时用到这种函数。其实最好的学习资料就是官方自带的examples了。我这里用的是0.10版本hive,所以对于的examples在https://github.com/apache/hive/tree/branch-0.10/contri

2014-12-14 00:38:55 3203

原创 Hive自定义函数UDF开发

Hive自定义函数UDF开发Hive支持自定义函数,UDF是接受一行,输出一行。函数通常是接受一行中某几个字段作为参数,然后返回一个值。值得注意的是,hive的一个特别之处是数据类型很丰富,一个字段不仅仅可以是string,int,还可以是map,list。其实最好的学习资料就是官方自带的examples了。我这里用的是0.10版本hive,所以对于的examples在

2014-12-14 00:29:07 2098

原创 mahout入门指南之mahout单机版推荐算法

mahout入门指南之mahout单机版推荐算法 鄙人最近在研究mahout,网上找了一些入门资料来看,发现都整理的比较乱。折腾了一番,终于搞清楚了。为了让新手们较快入门,决定总结分享一下,写此入门指南。 mahout是什么?mahout是一个机器学习库,里面实现了一些算法,比如推荐算法,聚类算法。实现方式有单机内存版,也有分布式(hadoop和spark)。

2014-12-06 14:50:41 6378

京东评论数据集

http://blog.csdn.net/lingerlanlan/article/details/38418277 京东评论情感分类器(基于bag-of-words模型) 数据集

2014-08-15

文件系统的实现 linux ext2fs 中山大学 万海 界面 操作系统

文件系统的实现 linux ext2fs 中山大学 万海 界面 操作系统

2011-11-28

关于飞信api关于飞信api

关于飞信api关于飞信api关于飞信api关于飞信api关于飞信api

2011-04-19

study on twitter

study on twitterstudy on twitterstudy on twitterstudy on twitter

2011-04-19

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除