- 博客(8)
- 资源 (4)
- 收藏
- 关注
原创 层次分析法量化用户的产品偏好
层次分析法量化用户的产品偏好 用户对产品有很多行为,如何进行用户行为分析来量化用户对产品的喜好程度呢? 比如豆瓣FM,用户可以点击“喜好”和"扔进垃圾箱"等;比如优酷视频,用户可以顶,踩,分享等。 我们如何通过这些行为信息分析用户对这首歌的喜好程度,对这个视频的评分是多少。
2014-12-19 01:03:15 7700 1
原创 CSDN2014博客之星评选(求投票支持)
CSDN2014博客之星评选(求投票支持)http://vote.blog.csdn.net/blogstar2014/details?username=linger2012liu#content大家好,2014年CSDN博客之星评选开始了。如果我的博客对您有所帮忙,还望您百忙之中抽空投我一票,非常您一直以来的支持和鼓励。投票网址:http://vote.blog.csdn.net/blogstar2014/details?username=linger2012liu#content
2014-12-31 23:21:03 2174 1
原创 Mongodb杂谈(一)
Mongodb杂谈(一)开始学习mongodb时,找一些中文博客看。后来发现很多知识都搜不到,最后还是看官方网站和权威指南,还是这两者靠谱,闲的时候可以多浏览一下。此文总结一下我入门学习mongodb的经验。 Mongo shell操作mongodb 安装完mongodb客户端后,通过shelll来操作mongodb。我是在Ubuntu使用客户端的,直接用ap
2014-12-26 23:29:32 1790
原创 maven打包hadoop项目(含第三方jar)
maven打包hadoop项目(含第三方jar) 问题背景:1 写map-reduce程序,用到第三方jar,怎么打包并提交项目到服务器执行。2 mahout中itembased算法,将uid从string映射为long。 我这里实现的具体功能是:Mahout的itembased算法的数据格式是:uid,vid,score。其中uid和vid必须是数字型(long),s
2014-12-25 00:12:46 6551 1
原创 mahout入门指南之基于mahout的itembased算法
基于mahout的itembased算法 其实mahout分布式上只是实现了部分算法。比如推荐算法中Item-based和slopone都有hadoop实现和单机版实现,User-based没有分布式实现。 Mahout已实现的算法(单机版和分布式版)https://mahout.apache.org/users/basics/algorithms.html 大多
2014-12-22 23:20:44 3214
原创 Hive自定义函数UDAF开发
Hive自定义函数UDAF开发Hive支持自定义函数,UDAF是接受多行,输出一行。通常是group by时用到这种函数。其实最好的学习资料就是官方自带的examples了。我这里用的是0.10版本hive,所以对于的examples在https://github.com/apache/hive/tree/branch-0.10/contri
2014-12-14 00:38:55 3203
原创 Hive自定义函数UDF开发
Hive自定义函数UDF开发Hive支持自定义函数,UDF是接受一行,输出一行。函数通常是接受一行中某几个字段作为参数,然后返回一个值。值得注意的是,hive的一个特别之处是数据类型很丰富,一个字段不仅仅可以是string,int,还可以是map,list。其实最好的学习资料就是官方自带的examples了。我这里用的是0.10版本hive,所以对于的examples在
2014-12-14 00:29:07 2098
原创 mahout入门指南之mahout单机版推荐算法
mahout入门指南之mahout单机版推荐算法 鄙人最近在研究mahout,网上找了一些入门资料来看,发现都整理的比较乱。折腾了一番,终于搞清楚了。为了让新手们较快入门,决定总结分享一下,写此入门指南。 mahout是什么?mahout是一个机器学习库,里面实现了一些算法,比如推荐算法,聚类算法。实现方式有单机内存版,也有分布式(hadoop和spark)。
2014-12-06 14:50:41 6378
京东评论数据集
2014-08-15
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人