- 博客(13)
- 资源 (19)
- 收藏
- 关注
原创 Spark MLlib 之 数据类型与大规模数据集的相似度计算原理探索
最近小编在做的是计算两两用户的粉丝重合度,根据粉丝重合度去评估两个用户之间的相似度,根据条件进行过滤之后大概有3000个用户,但每个用户的粉丝量参差不齐,有上百万的,有几千的,这样在去构建笛卡尔积的时候,进行粉丝数据关联,得到的用户集就会特别大,spark运行的时候就会很慢,而且会出现很严重的数据倾斜。这个时候了解到了spark支持的数据类型,看到了CoordinateMatrix,然后深究其原理,便看到了这篇文章,经过整理形成了此文。
2019-07-29 15:41:15 2062 1
原创 《推荐系统开发实战》之业内推荐系统架构介绍
转载请注明出处:http://blog.csdn.net/gamer_gyt博主微博:http://weibo.com/234654758Github:https://github.com/thinkgamer公众号:搜索与推荐Wiki个人网站:http://thinkgamer.github.io不管是电商网站,还是新闻资讯类网站,推荐系统都扮演着十分重要的角色。一个优秀的推荐系统...
2019-07-20 08:38:45 3721
原创 《推荐系统开发实战》之三大案例带你从0到1自己实现一个推荐系统
转载请注明出处:http://blog.csdn.net/gamer_gyt博主微博:http://weibo.com/234654758Github:https://github.com/thinkgamer公众号:搜索与推荐Wiki个人网站:http://thinkgamer.github.io俗话说的好:“眼看千遍,不如手写一遍”,前几篇介绍了推荐系统的来源、发展、数据预处理、...
2019-07-20 08:38:08 11354 16
原创 《推荐系统开发实战》之效果评估
转载请注明出处:http://blog.csdn.net/gamer_gyt博主微博:http://weibo.com/234654758Github:https://github.com/thinkgamer公众号:搜索与推荐Wiki个人网站:http://thinkgamer.github.io推荐系统的评估方法分为用户调研、在线评估和离线评估。用户调研推荐系统的离线实验指...
2019-07-19 08:18:07 3199
原创 《推荐系统开发实战》之冷启动介绍与解决
转载请注明出处:http://blog.csdn.net/gamer_gyt博主微博:http://weibo.com/234654758Github:https://github.com/thinkgamer公众号:搜索与推荐Wiki个人网站:http://thinkgamer.github.io推荐系统基于用户大量的历史行为做出事物呈现,因此用户的历史行为数据是构建一个优质推荐系...
2019-07-18 22:37:44 2585
原创 《推荐系统开发实战》之基于点击率预估的推荐算法介绍和案例开发实战
转载请注明出处:http://blog.csdn.net/gamer_gyt博主微博:http://weibo.com/234654758Github:https://github.com/thinkgamer公众号:搜索与推荐Wiki个人网站:http://thinkgamer.github.io本系列之前介绍的都是一些基本的推荐算法,将这些算法真正应用到工业界(即应用推荐系统的地...
2019-07-17 23:24:05 4201
原创 《推荐系统开发实战》之基于标签的推荐算法介绍和案例实战开发
转载请注明出处:http://blog.csdn.net/gamer_gyt博主微博:http://weibo.com/234654758Github:https://github.com/thinkgamer公众号:搜索与推荐Wiki个人网站:http://thinkgamer.github.io标签系统的传统用法是,在一些网站中,用户会为自己感兴趣的对象打上一些标签,如豆瓣、网易...
2019-07-15 22:20:17 4102
原创 《推荐系统开发实战》之基于上下文的推荐算法介绍和案例实战开发
转载请注明出处:http://blog.csdn.net/gamer_gyt博主微博:http://weibo.com/234654758Github:https://github.com/thinkgamer公众号:搜索与推荐Wiki个人网站:http://thinkgamer.github.io个性化推荐是数据挖掘(Data Mining)中的一个目的明确的应用场景,所以,可以利...
2019-07-15 22:12:20 2323
原创 《推荐系统开发实战》之基于用户行为特征的推荐算法介绍和案例实战开发
转载请注明出处:http://blog.csdn.net/gamer_gyt博主微博:http://weibo.com/234654758Github:https://github.com/thinkgamer公众号:搜索与推荐Wiki个人网站:http://thinkgamer.github.io推荐系统的受众对象为用户,只有明白用户的意图,才能给用户推荐更好的内容。基于用户行为特...
2019-07-14 23:02:36 3935 1
原创 《推荐系统开发实战》之推荐系统的灵魂伴侣-数据挖掘
转载请注明出处:http://blog.csdn.net/gamer_gyt博主微博:http://weibo.com/234654758Github:https://github.com/thinkgamer公众号:搜索与推荐Wiki个人网站:http://thinkgamer.github.io个性化推荐是数据挖掘(Data Mining)中的一个目的明确的应用场景,所以,可以利...
2019-07-12 08:04:00 5746 2
原创 《推荐系统开发实战》之从搭建一个电影推荐系统开始学推荐系统开发实战
推荐系统在我们的生活中无处不在,比如购物网站,视频音乐网站,新闻网站等,那么推荐系统是如何工作的,他是基于什么方式实现的?可以在《推荐系统开发实战》这本书中进行系统的了解和学习,本篇文章是该系列文章的开篇之作,带领大家认识一下基于最近相似用户的推荐。以下内容摘自于《推荐系统开发实战》
2019-07-10 23:46:45 8352
原创 《推荐系统开发实战》之推荐系统的前世今生与古往今来
转载请注明出处:http://blog.csdn.net/gamer_gyt博主微博:http://weibo.com/234654758Github:https://github.com/thinkgamer公众号:搜索与推荐Wiki个人网站:http://thinkgamer.github.io接下来将会用10篇文章介绍下推荐系统的起源,应用,算法和案例,并带领大家从0到1实现属...
2019-07-10 08:03:46 7314 6
原创 论文|完整空间多任务模型(Entire Space Multi-Task Model)
转载请注明出处:http://blog.csdn.net/gamer_gyt博主微博:http://weibo.com/234654758Github:https://github.com/thinkgamer公众号:搜索与推荐Wiki个人网站:http://thinkgamer.github.io论文:Entire Space Multi-Task Model: An Effect...
2019-07-07 18:38:26 2780 2
word2vec.zip
2019-11-13
NLP汉语自然语言处理原理与实战
2018-06-15
gephi-0.9.1-windows.exe
2017-02-14
mysql-connector-java-5.0.4-bin.jar
2017-02-14
commons-el-1.0.jar,jasper-compiler.jar,jasper-runtime.jar
2016-07-28
从疝气病症预测病马的死亡率的测试数据集
2016-04-25
十大算法之线性查找算法
2015-07-29
securboot未完全配置消除补丁
2014-08-23
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人