自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Thinkgamer博客

处女作:推荐系统开发实战,公众号:搜索与推荐Wiki

  • 博客(13)
  • 资源 (19)
  • 收藏
  • 关注

原创 Spark MLlib 之 数据类型与大规模数据集的相似度计算原理探索

最近小编在做的是计算两两用户的粉丝重合度,根据粉丝重合度去评估两个用户之间的相似度,根据条件进行过滤之后大概有3000个用户,但每个用户的粉丝量参差不齐,有上百万的,有几千的,这样在去构建笛卡尔积的时候,进行粉丝数据关联,得到的用户集就会特别大,spark运行的时候就会很慢,而且会出现很严重的数据倾斜。这个时候了解到了spark支持的数据类型,看到了CoordinateMatrix,然后深究其原理,便看到了这篇文章,经过整理形成了此文。

2019-07-29 15:41:15 2062 1

原创 《推荐系统开发实战》之业内推荐系统架构介绍

转载请注明出处:http://blog.csdn.net/gamer_gyt博主微博:http://weibo.com/234654758Github:https://github.com/thinkgamer公众号:搜索与推荐Wiki个人网站:http://thinkgamer.github.io不管是电商网站,还是新闻资讯类网站,推荐系统都扮演着十分重要的角色。一个优秀的推荐系统...

2019-07-20 08:38:45 3720

原创 《推荐系统开发实战》之三大案例带你从0到1自己实现一个推荐系统

转载请注明出处:http://blog.csdn.net/gamer_gyt博主微博:http://weibo.com/234654758Github:https://github.com/thinkgamer公众号:搜索与推荐Wiki个人网站:http://thinkgamer.github.io俗话说的好:“眼看千遍,不如手写一遍”,前几篇介绍了推荐系统的来源、发展、数据预处理、...

2019-07-20 08:38:08 11320 16

原创 《推荐系统开发实战》之效果评估

转载请注明出处:http://blog.csdn.net/gamer_gyt博主微博:http://weibo.com/234654758Github:https://github.com/thinkgamer公众号:搜索与推荐Wiki个人网站:http://thinkgamer.github.io推荐系统的评估方法分为用户调研、在线评估和离线评估。用户调研推荐系统的离线实验指...

2019-07-19 08:18:07 3198

原创 《推荐系统开发实战》之冷启动介绍与解决

转载请注明出处:http://blog.csdn.net/gamer_gyt博主微博:http://weibo.com/234654758Github:https://github.com/thinkgamer公众号:搜索与推荐Wiki个人网站:http://thinkgamer.github.io推荐系统基于用户大量的历史行为做出事物呈现,因此用户的历史行为数据是构建一个优质推荐系...

2019-07-18 22:37:44 2583

原创 《推荐系统开发实战》之基于点击率预估的推荐算法介绍和案例开发实战

转载请注明出处:http://blog.csdn.net/gamer_gyt博主微博:http://weibo.com/234654758Github:https://github.com/thinkgamer公众号:搜索与推荐Wiki个人网站:http://thinkgamer.github.io本系列之前介绍的都是一些基本的推荐算法,将这些算法真正应用到工业界(即应用推荐系统的地...

2019-07-17 23:24:05 4195

原创 《推荐系统开发实战》之基于标签的推荐算法介绍和案例实战开发

转载请注明出处:http://blog.csdn.net/gamer_gyt博主微博:http://weibo.com/234654758Github:https://github.com/thinkgamer公众号:搜索与推荐Wiki个人网站:http://thinkgamer.github.io标签系统的传统用法是,在一些网站中,用户会为自己感兴趣的对象打上一些标签,如豆瓣、网易...

2019-07-15 22:20:17 4100

原创 《推荐系统开发实战》之基于上下文的推荐算法介绍和案例实战开发

转载请注明出处:http://blog.csdn.net/gamer_gyt博主微博:http://weibo.com/234654758Github:https://github.com/thinkgamer公众号:搜索与推荐Wiki个人网站:http://thinkgamer.github.io个性化推荐是数据挖掘(Data Mining)中的一个目的明确的应用场景,所以,可以利...

2019-07-15 22:12:20 2322

原创 《推荐系统开发实战》之基于用户行为特征的推荐算法介绍和案例实战开发

转载请注明出处:http://blog.csdn.net/gamer_gyt博主微博:http://weibo.com/234654758Github:https://github.com/thinkgamer公众号:搜索与推荐Wiki个人网站:http://thinkgamer.github.io推荐系统的受众对象为用户,只有明白用户的意图,才能给用户推荐更好的内容。基于用户行为特...

2019-07-14 23:02:36 3933 1

原创 《推荐系统开发实战》之推荐系统的灵魂伴侣-数据挖掘

转载请注明出处:http://blog.csdn.net/gamer_gyt博主微博:http://weibo.com/234654758Github:https://github.com/thinkgamer公众号:搜索与推荐Wiki个人网站:http://thinkgamer.github.io个性化推荐是数据挖掘(Data Mining)中的一个目的明确的应用场景,所以,可以利...

2019-07-12 08:04:00 5745 2

原创 《推荐系统开发实战》之从搭建一个电影推荐系统开始学推荐系统开发实战

推荐系统在我们的生活中无处不在,比如购物网站,视频音乐网站,新闻网站等,那么推荐系统是如何工作的,他是基于什么方式实现的?可以在《推荐系统开发实战》这本书中进行系统的了解和学习,本篇文章是该系列文章的开篇之作,带领大家认识一下基于最近相似用户的推荐。以下内容摘自于《推荐系统开发实战》

2019-07-10 23:46:45 8352

原创 《推荐系统开发实战》之推荐系统的前世今生与古往今来

转载请注明出处:http://blog.csdn.net/gamer_gyt博主微博:http://weibo.com/234654758Github:https://github.com/thinkgamer公众号:搜索与推荐Wiki个人网站:http://thinkgamer.github.io接下来将会用10篇文章介绍下推荐系统的起源,应用,算法和案例,并带领大家从0到1实现属...

2019-07-10 08:03:46 7313 6

原创 论文|完整空间多任务模型(Entire Space Multi-Task Model)

转载请注明出处:http://blog.csdn.net/gamer_gyt博主微博:http://weibo.com/234654758Github:https://github.com/thinkgamer公众号:搜索与推荐Wiki个人网站:http://thinkgamer.github.io论文:Entire Space Multi-Task Model: An Effect...

2019-07-07 18:38:26 2780 2

grafana-6.3.3-1 rpm安装包.zip

grafana-6.3.3-1.x86_64.rpm 安装包,

2020-04-09

word2vec.zip

word2vec 官方资源未修改版和malloc函数替换版,官方源码 需要科学上网才能获取,这里进行提供,同时mac os系统下需要修改malloc函数方可使用,这里也提供一份修改后的

2019-11-13

NLP汉语自然语言处理原理与实战

自然语言处理大体是从1950年代开始,虽然更早期也有作为。1950年,图灵发表论文“计算机器与智能”,提出现在所谓的“图灵测试”作为判断智能的条件。 1954年的乔治城实验涉及全部自动翻译超过60句俄文成为英文。研究人员声称三到五年之内即可解决机器翻译的问题。[1]不过实际进展远低于预期,1966年的ALPAC报告发现十年研究未达预期目标,机器翻译的研究经费遭到大幅削减。一直到1980年代末期,统计机器翻译系统发展出来,机器翻译的研究才得以更上一层楼。 1960年代发展特别成功的NLP系统包括SHRDLU——一个词汇设限、运作于受限如“积木世界”的一种自然语言系统,以及1964-1966年约瑟夫·维森鲍姆模拟“个人中心治疗”而设计的ELIZA——几乎未运用人类思想和感情的讯息,有时候却能呈现令人讶异地类似人之间的互动。“病人”提出的问题超出ELIZA 极小的知识范围之时,可能会得到空泛的回答。例如问题是“我的头痛”,回答是“为什么说你头痛?

2018-06-15

一种人脸表情分类的新方法_Manhattan距离

一种人脸表情分类的新方法_Manhattan距离_李俊华.pdf

2017-07-15

gephi-0.9.1-windows.exe

2017-02-14

mysql-connector-java-5.0.4-bin.jar

2017-02-14

commons-el-1.0.jar,jasper-compiler.jar,jasper-runtime.jar

commons-el-1.0.jar,jasper-compiler.jar,jasper-runtime.jar

2016-07-28

delicious.dat

经过预处理的。数据格式 [ USER_ID , URL_ID , Tags ] 。

2016-06-16

kosarak.dat

FP_Tree算法构建新闻点击流的数据集

2016-05-09

从疝气病症预测病马的死亡率的测试数据集

2016-04-25

从疝气病症预测病马的死亡率的训练数据集

从疝气病症预测病马的死亡率的训练数据集,机器学习实战第五章logistic回归实例数据

2016-04-25

hadoop-eclipse-plugin-2.6.0.jar

hadoop-eclipse-plugin-2.6.0.jar

2015-08-02

lucene4.3.0+IK Analyzer2012FF

lucene4.3.0+IK Analyzer2012FF

2015-07-31

IKAnalyzer_all_jar

IKAnalyzer_all_jar,适用于中文分词(Java和mapreduce)

2015-07-31

十大算法之线性查找算法

算法步骤: 1. 将n个元素每5个一组,分成n/5(上界)组。 2. 取出每一组的中位数,任意排序方法,比如插入排序。 3. 递归的调用selection算法查找上一步中所有中位数的中位数,设为x,偶数个中位数的情况下设定为选取中间小的一个。 4. 用x来分割数组,设小于等于x的个数为k,大于x的个数即为n-k。 5. 若i==k,返回x;若ik,在大于x的元素中递归查找第i-k小的元素。 终止条件:n=1时,返回的即是i小元素。

2015-07-29

高精度的加减乘除

高精度对于初学者来说并不是容易的,所以小编在这里这里整理了高精度的加减乘除运算,在一个程序中实现,希望对各位童鞋有所帮助

2014-08-23

securboot未完全配置消除补丁

在我们新安装windows系统后在桌面右下角会出现securboot未完全配置消除补丁这些字,若在BIOS中设置的话对电脑某些功能有影响(如电脑装有双系统,另一个系统进不去,或者电脑不能正常开机),此时就需要这样一个补丁来解决这个问题

2014-08-23

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除