自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Thinkgamer博客

处女作:推荐系统开发实战,公众号:搜索与推荐Wiki

  • 博客(375)
  • 资源 (19)
  • 收藏
  • 关注

原创 《推荐系统开发实战》之基于点击率预估的推荐算法介绍和案例开发实战

转载请注明出处:http://blog.csdn.net/gamer_gyt博主微博:http://weibo.com/234654758Github:https://github.com/thinkgamer公众号:搜索与推荐Wiki个人网站:http://thinkgamer.github.io本系列之前介绍的都是一些基本的推荐算法,将这些算法真正应用到工业界(即应用推荐系统的地...

2019-07-17 23:24:05 4193

原创 《推荐系统开发实战》之基于标签的推荐算法介绍和案例实战开发

转载请注明出处:http://blog.csdn.net/gamer_gyt博主微博:http://weibo.com/234654758Github:https://github.com/thinkgamer公众号:搜索与推荐Wiki个人网站:http://thinkgamer.github.io标签系统的传统用法是,在一些网站中,用户会为自己感兴趣的对象打上一些标签,如豆瓣、网易...

2019-07-15 22:20:17 4099

原创 《推荐系统开发实战》之基于上下文的推荐算法介绍和案例实战开发

转载请注明出处:http://blog.csdn.net/gamer_gyt博主微博:http://weibo.com/234654758Github:https://github.com/thinkgamer公众号:搜索与推荐Wiki个人网站:http://thinkgamer.github.io个性化推荐是数据挖掘(Data Mining)中的一个目的明确的应用场景,所以,可以利...

2019-07-15 22:12:20 2322

原创 《推荐系统开发实战》之基于用户行为特征的推荐算法介绍和案例实战开发

转载请注明出处:http://blog.csdn.net/gamer_gyt博主微博:http://weibo.com/234654758Github:https://github.com/thinkgamer公众号:搜索与推荐Wiki个人网站:http://thinkgamer.github.io推荐系统的受众对象为用户,只有明白用户的意图,才能给用户推荐更好的内容。基于用户行为特...

2019-07-14 23:02:36 3933 1

原创 《推荐系统开发实战》之推荐系统的灵魂伴侣-数据挖掘

转载请注明出处:http://blog.csdn.net/gamer_gyt博主微博:http://weibo.com/234654758Github:https://github.com/thinkgamer公众号:搜索与推荐Wiki个人网站:http://thinkgamer.github.io个性化推荐是数据挖掘(Data Mining)中的一个目的明确的应用场景,所以,可以利...

2019-07-12 08:04:00 5745 2

原创 《推荐系统开发实战》之从搭建一个电影推荐系统开始学推荐系统开发实战

推荐系统在我们的生活中无处不在,比如购物网站,视频音乐网站,新闻网站等,那么推荐系统是如何工作的,他是基于什么方式实现的?可以在《推荐系统开发实战》这本书中进行系统的了解和学习,本篇文章是该系列文章的开篇之作,带领大家认识一下基于最近相似用户的推荐。以下内容摘自于《推荐系统开发实战》

2019-07-10 23:46:45 8352

原创 《推荐系统开发实战》之推荐系统的前世今生与古往今来

转载请注明出处:http://blog.csdn.net/gamer_gyt博主微博:http://weibo.com/234654758Github:https://github.com/thinkgamer公众号:搜索与推荐Wiki个人网站:http://thinkgamer.github.io接下来将会用10篇文章介绍下推荐系统的起源,应用,算法和案例,并带领大家从0到1实现属...

2019-07-10 08:03:46 7313 6

原创 论文|完整空间多任务模型(Entire Space Multi-Task Model)

转载请注明出处:http://blog.csdn.net/gamer_gyt博主微博:http://weibo.com/234654758Github:https://github.com/thinkgamer公众号:搜索与推荐Wiki个人网站:http://thinkgamer.github.io论文:Entire Space Multi-Task Model: An Effect...

2019-07-07 18:38:26 2780 2

原创 Spark排序算法系列之(MLLib、ML)GBDT+LR使用方式介绍(模型训练、保存、加载、预测)

转载请注明出处:http://blog.csdn.net/gamer_gyt博主微博:http://weibo.com/234654758Github:https://github.com/thinkgamer公众号:数据与算法联盟个人网站:http://thinkgamer.github.io【Spark排序算法系列】主要介绍的是目前推荐系统或者广告点击方面用的比较广的几种算法,和...

2019-05-13 22:54:38 6324 10

原创 Spark排序算法系列之(MLLib、ML)LR使用方式介绍(模型训练、保存、加载、预测)

转载请注明出处:http://blog.csdn.net/gamer_gyt博主微博:http://weibo.com/234654758Github:https://github.com/thinkgamer公众号:数据与算法联盟个人网站:http://thinkgamer.github.io【Spark排序算法系列】主要介绍的是目前推荐系统或者广告点击方面用的比较广的几种算法,和...

2019-05-07 10:47:27 5460 6

原创 常见的五种神经网络(1)-前馈神经网络

转载请注明出处:http://blog.csdn.net/gamer_gyt博主微博:http://weibo.com/234654758Github:https://github.com/thinkgamer公众号:数据与算法联盟给定一组神经元,我们可以以神经元为节点来构建一个网络。不同的神经网络模型有着不同网络连接的拓扑结构。一种比较直接的拓扑结构是前馈网络。前馈神经网络(Feed...

2019-04-23 16:36:43 44955 6

原创 神经网络中的激活函数介绍

转载请注明出处:http://blog.csdn.net/gamer_gyt博主微博:http://weibo.com/234654758Github:https://github.com/thinkgamer公众号:数据与算法联盟人工神经元(Artifical Neuron)简称神经元(Neuron),是构成神经网络的基本单元,其主要是模拟生物神经元的结构和特性,接受一组输入信息并产...

2019-04-21 22:25:15 5706

原创 线性模型篇之SVM数学公式推导

转载请注明出处:http://blog.csdn.net/gamer_gyt博主微博:http://weibo.com/234654758Github:https://github.com/thinkgamer公众号:数据与算法联盟支持向量机(Support Vector Machine,SVM)是一个经典两类分类算法,其找到的分割超平面具有更好的鲁棒性,因此广泛使用在很多任务上,并表...

2019-04-21 00:17:00 2904

原创 线性模型篇之感知机(PLA)数学公式推导

感知机(Perceptron)是一种广泛使用的线性分类器,相当于最简单的人工神经网络,只有一个神经元。其全称是PLA(Perceptron Linear Algorithm),线性感知机算法。感知机是对生物神经元的简单数学模型,有与生物神经元相对应的部件,比如权重(突触)、偏置(阈值)及激活函数(细胞体),输出值为 +1 或者 -1。

2019-04-16 19:13:32 4127 1

原创 线性模型篇之softmax数学公式推导

打开微信扫一扫,关注微信公众号【数据与算法联盟】 转载请注明出处:http://blog.csdn.net/gamer_gyt博主微博:http://weibo.com/234654758Github:https://github.com/thinkgamerSoftmax回归也称多项(multinomial)或者多类(multi-class)的Logistic回归,是Logis...

2019-04-10 07:24:46 3715

原创 线性模型篇之Logistic Regression数学公式推导

打开微信扫一扫,关注微信公众号【数据与算法联盟】 转载请注明出处:http://blog.csdn.net/gamer_gyt博主微博:http://weibo.com/234654758Github:https://github.com/thinkgamer两分类与多分类两类分类(Binary Classification)类别标签y只有两种取值,通常设为{0,1}线性...

2019-04-02 22:31:51 2412

原创 不同分类标准下的机器学习算法分类

打开微信扫一扫,关注微信公众号【数据与算法联盟】 转载请注明出处:http://blog.csdn.net/gamer_gyt博主微博:http://weibo.com/234654758Github:https://github.com/thinkgamer机器学习算法可以按照不同的标准进行分类。比如按函数f(X)的不同,机器学习算法可以分为线性模型和非线性模型;按照学习准则的...

2019-03-26 17:43:37 2948

原创 从线性回归看偏差-方差分解(Bias-Variance Decomposition)

打开微信扫一扫,关注微信公众号【数据与算法联盟】 转载请注明出处:http://blog.csdn.net/gamer_gyt博主微博:http://weibo.com/234654758Github:https://github.com/thinkgamer概述对于数字序列1,3,5,7,?,正常情况下大家脑海里蹦出的是9,但是217314也是其一个解9对应的数学公式为f(...

2019-03-25 23:18:55 6470

原创 排序模型训练中过程中的损失函数,盘它!

转载请注明出处:http://blog.csdn.net/gamer_gyt博主微博:http://weibo.com/234654758Github:https://github.com/thinkgamer公众号:搜索与推荐Wiki个人网站:http://thinkgamer.github.io损失函数是用来估量你模型的预测值f(x)与真实值Y的不一致程度,它是一个非负实值...

2019-03-12 23:57:01 8045

原创 基于神经网络实现Mnist数据集的多分类

在之前的文章中介绍了基于Logistic Regression实现Mnist数据集的多分类,本篇文章主要介绍基于TensorFlow实现Mnist数据集的多分类。一个典型的神经网络训练图如下所示:只不过在Mnist数据集是十分类的,起输出由y1和y2换成y1,....,y10。本文实现的神经网络如下所示:这是使用的是两层的神经网络,第一层神经元个数是256,第二层为128,最终...

2019-03-09 21:19:08 3882 1

原创 【技术分享】机器学习在微博信息流推荐中的应用实践

转载请注明出处:http://blog.csdn.net/gamer_gyt博主微博:http://weibo.com/234654758Github:https://github.com/thinkgamer公众号:搜索与推荐Wiki个人网站:http://thinkgamer.github.io本文分为四部分介绍机器学习在微博信息流中的应用实践,分别为:微博信息流推荐场景介绍,...

2019-03-05 08:03:35 1858

原创 TensorFlow实现Mnist数据集的多分类逻辑回归模型

个人网站:   文艺与Code | Thinkgamer的博客CSDN博客:Thinkgamer技术专栏知乎:         &

2019-02-27 13:15:55 2072

原创 深度学习中的epochs、batch_size、iterations详解

![这里写图片描述](http://img.blog.csdn.net/20171214192212990?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvR2FtZXJfZ3l0/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast)打开微信扫一扫,关注微...

2019-02-26 00:32:29 15770

原创 Spark排序算法系列之(MLLib、ML)GBTs使用方式介绍(模型训练、保存、加载、预测)

前言【Spark排序算法系列】主要介绍的是目前推荐系统或者广告点击方面用的比较广的几种算法,和他们在Spark中的应用实现,本篇文章主要介绍GBDT算法,本系列还包括(持续更新): Spark排序算法系列之LR(逻辑回归) Spark排序算法系列之模型融合(GBDT+LR) Spark排序算法系列之XGBoost Spark排序算法系列之FTRL(Follo...

2019-01-29 21:16:35 3725 4

原创 资源分享:从数理统计到DL、RL,还不快来!

之前在自己的年度总结里写到:19年的目标就是技术沉淀与突破。技术突破不仅包含现有技术的总结和反思,更是对未知技术的探索和求知,希望19年能够更上一层楼。这个repo是我一直维护和整理的一个技术资料分享的repo,是我包括群友一块整理的一个免费技术资料分享的库,不仅包含了机器学习,数据挖掘,深度学习,还包含了大数据,数理统计,强化学习等,希望在技术这条路上你能跑的更快。repo:http...

2019-01-28 03:16:19 2167

原创 多分类实现方式介绍和在Spark上实现多分类逻辑回归(Multinomial Logistic Regression)

背景在之前的文章中介绍了多分类逻辑回归算法的数据原理,参考文章链接CSDN文章链接:https://blog.csdn.net/Gamer_gyt/article/details/85209496 公众号:多分类逻辑回归(Multinomial Logistic Regression)该篇文章介绍一下Spark中多分类算法,主要包括的技术点如下多分类实现方式 一对一 (One V...

2019-01-12 22:06:02 3899 5

原创 Hive Join 分析和优化

转载请注明出处:http://blog.csdn.net/gamer_gyt博主微博:http://weibo.com/234654758Github:https://github.com/thinkgamer背景Sku对应品牌进行关联,大表对应非大表(这里的非大表并不能用小表来定义)问题分析进行表左关联时,最后一个reduce任务卡到99%,运行时间很长,发生了...

2019-01-03 13:34:48 1896

原创 基于TF-IDF算法的短标题关键词提取

转载请注明出处:http://blog.csdn.net/gamer_gyt博主微博:http://weibo.com/234654758Github:https://github.com/thinkgamer扫一扫 关注微信公众号!号主 专注于搜索和推荐系统,尝试使用算法去更好的服务于用户,包括但不局限于机器学习,深度学习,强化学习,自然语言理解,知识图谱,还不定时分享技术,...

2019-01-03 13:27:48 5281 6

原创 TensorFlow 特征工程: feature_column

转载请注明出处:http://blog.csdn.net/gamer_gyt博主微博:http://weibo.com/234654758Github:https://github.com/thinkgamer特征工程: feature_column在使用很多模型的时候,都需要对输入的数据进行必要的特征工程处理。最典型的就是:one-hot处理,还有hash分桶等处理。为...

2019-01-03 13:18:16 4043

原创 有监督学习算法的集成学习(Ensemble Learning)介绍

转载请注明出处:http://blog.csdn.net/gamer_gyt博主微博:http://weibo.com/234654758Github:https://github.com/thinkgamer在机器学习的有监督学习算法中,我们的目标是学习出一个稳定的且在各个方面表现都较好的模型,但实际情况往往不这么理想,有时我们只能得到多个有偏好的模型(弱监督模型,在某些方面表...

2019-01-03 13:14:38 2008

原创 【内附PDF资料】Python实现下载图片并生产PDF文件

转载请注明出处:http://blog.csdn.net/gamer_gyt博主微博:http://weibo.com/234654758Github:https://github.com/thinkgamer背景2018AICon大会中的一些PPT,官方没有提供完整的PDF文件,而是一张张图片,不方便下载和后续阅读,这里使用Python爬取相关演讲的图片,并生产PDF文...

2019-01-02 20:28:22 1516

原创 趁“未老”,再认真一次,我觉得你能更好!

每一年的年尾,我都会问自己:这一年,我收获了什么? 你呢? 这一年,我收获了很多东西,也学会和体验到了很多,用户八个字来概括就是:不忘粗心,方得始终。 小白 ...

2018-12-29 04:22:41 1760

原创 多分类逻辑回归(Multinomial Logistic Regression)

前言分类从结果的数量上可以简单的划分为:二分类(Binary Classification) 多分类(Multinomial Classification)。其中二分类是最常见且使用最多的分类场景,解决二分类的算法有很多,比如:基本的KNN、贝叶斯、SVM Online Ranking中用来做二分类的包括FM、FFM、GBDT、LR、XGBoost等多分类中比如:改进版...

2018-12-22 15:53:10 51547 3

原创 吴恩达《Machine Learning Yearning》中文版!

吴恩达老师在离开百度之后创建了deplearning.ai,在AI研究的道路上从未停下脚步,在其网站上不仅更新了AI课程,还有最新力作《Machine Learning Yearning》,目前该书的中文版也已经问世! ...

2018-10-28 10:44:44 4677

原创 点击率预估中的FM算法&FFM算法

转载请注明出处:https://blog.csdn.net/gamer_gyt/article/details/81038913博主微博:http://weibo.com/234654758Github:https://github.com/thinkgamer特征决定了所有算法效果的上限,而不同的算法只是离这个上限的距离不同而已CTR方法概览 广义线性模型+人工特征...

2018-07-13 23:28:18 3879

转载 商品人气分模型

【转自:https://zhuanlan.zhihu.com/p/35512064】在电商平台中,量化每个商品的静态质量及受欢迎的程度有着重要的意义。我们把这个量化值称之为商品人气分。商品人气分在搜索排序、个性化推荐排序及推荐候选集截断、竞价广告系统中都有着重要的应用。商品人气分受哪些因素的影响,以及这些因素最终如何共同决定商品人气分值?本文总结了一个实际系统中人气分模型的构建过程,从特征...

2018-06-19 21:09:59 4200

原创 TensorFlow的逻辑回归实现

打开微信扫一扫,关注微信公众号【数据与算法联盟】 转载请注明出处:http://blog.csdn.net/gamer_gyt 博主微博:http://weibo.com/234654758 Github:https://github.com/thinkgamer 逻辑回归我们都知道是用来进行二分类处理的,里边经常用到的阶跃函数是海维塞得阶跃函数(Sig...

2018-04-28 02:08:02 3979

原创 回归分析之逻辑回归-Logistic Regression

打开微信扫一扫,关注公众号【数据与算法联盟】 转载请注明出处:http://blog.csdn.net/gamer_gyt 博主微博:http://weibo.com/234654758 Github:https://github.com/thinkgamer回归分析之理论篇 回归分析之线性回归(N元线性回归) 回归分析之Sklearn实现电力预...

2018-04-28 01:45:42 6764

原创 TensorFlow的MNIST学习

打开微信扫一扫,关注微信公众号【数据与算法联盟】 转载请注明出处:http://blog.csdn.net/gamer_gyt 博主微博:http://weibo.com/234654758 Github:https://github.com/thinkgamer MNIST是在机器学习领域中的一个经典问题。该问题解决的是把28x28像素的灰度手写数字图...

2018-04-22 15:21:45 1365

原创 TensorFlow实现线性回归

打开微信扫一扫,关注微信公众号【数据与算法联盟】 转载请注明出处:http://blog.csdn.net/gamer_gyt 博主微博:http://weibo.com/234654758 Github:https://github.com/thinkgamer TensorFlow写简单的代码是大财小用,需要很繁琐的代码方能实现简单的功能,但对于复杂...

2018-04-22 14:27:59 1301

grafana-6.3.3-1 rpm安装包.zip

grafana-6.3.3-1.x86_64.rpm 安装包,

2020-04-09

word2vec.zip

word2vec 官方资源未修改版和malloc函数替换版,官方源码 需要科学上网才能获取,这里进行提供,同时mac os系统下需要修改malloc函数方可使用,这里也提供一份修改后的

2019-11-13

NLP汉语自然语言处理原理与实战

自然语言处理大体是从1950年代开始,虽然更早期也有作为。1950年,图灵发表论文“计算机器与智能”,提出现在所谓的“图灵测试”作为判断智能的条件。 1954年的乔治城实验涉及全部自动翻译超过60句俄文成为英文。研究人员声称三到五年之内即可解决机器翻译的问题。[1]不过实际进展远低于预期,1966年的ALPAC报告发现十年研究未达预期目标,机器翻译的研究经费遭到大幅削减。一直到1980年代末期,统计机器翻译系统发展出来,机器翻译的研究才得以更上一层楼。 1960年代发展特别成功的NLP系统包括SHRDLU——一个词汇设限、运作于受限如“积木世界”的一种自然语言系统,以及1964-1966年约瑟夫·维森鲍姆模拟“个人中心治疗”而设计的ELIZA——几乎未运用人类思想和感情的讯息,有时候却能呈现令人讶异地类似人之间的互动。“病人”提出的问题超出ELIZA 极小的知识范围之时,可能会得到空泛的回答。例如问题是“我的头痛”,回答是“为什么说你头痛?

2018-06-15

一种人脸表情分类的新方法_Manhattan距离

一种人脸表情分类的新方法_Manhattan距离_李俊华.pdf

2017-07-15

gephi-0.9.1-windows.exe

2017-02-14

mysql-connector-java-5.0.4-bin.jar

2017-02-14

commons-el-1.0.jar,jasper-compiler.jar,jasper-runtime.jar

commons-el-1.0.jar,jasper-compiler.jar,jasper-runtime.jar

2016-07-28

delicious.dat

经过预处理的。数据格式 [ USER_ID , URL_ID , Tags ] 。

2016-06-16

kosarak.dat

FP_Tree算法构建新闻点击流的数据集

2016-05-09

从疝气病症预测病马的死亡率的测试数据集

2016-04-25

从疝气病症预测病马的死亡率的训练数据集

从疝气病症预测病马的死亡率的训练数据集,机器学习实战第五章logistic回归实例数据

2016-04-25

hadoop-eclipse-plugin-2.6.0.jar

hadoop-eclipse-plugin-2.6.0.jar

2015-08-02

lucene4.3.0+IK Analyzer2012FF

lucene4.3.0+IK Analyzer2012FF

2015-07-31

IKAnalyzer_all_jar

IKAnalyzer_all_jar,适用于中文分词(Java和mapreduce)

2015-07-31

十大算法之线性查找算法

算法步骤: 1. 将n个元素每5个一组,分成n/5(上界)组。 2. 取出每一组的中位数,任意排序方法,比如插入排序。 3. 递归的调用selection算法查找上一步中所有中位数的中位数,设为x,偶数个中位数的情况下设定为选取中间小的一个。 4. 用x来分割数组,设小于等于x的个数为k,大于x的个数即为n-k。 5. 若i==k,返回x;若ik,在大于x的元素中递归查找第i-k小的元素。 终止条件:n=1时,返回的即是i小元素。

2015-07-29

高精度的加减乘除

高精度对于初学者来说并不是容易的,所以小编在这里这里整理了高精度的加减乘除运算,在一个程序中实现,希望对各位童鞋有所帮助

2014-08-23

securboot未完全配置消除补丁

在我们新安装windows系统后在桌面右下角会出现securboot未完全配置消除补丁这些字,若在BIOS中设置的话对电脑某些功能有影响(如电脑装有双系统,另一个系统进不去,或者电脑不能正常开机),此时就需要这样一个补丁来解决这个问题

2014-08-23

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除