- 博客(375)
- 资源 (19)
- 收藏
- 关注
原创 值得收藏 |近100页的《常见的五种神经网络》汇总电子书
首先在这里给各位读者分享一个好消息,我的处女作《推荐系统开发实战》已经被两所高校纳为教学用书了,当编辑把这个消息告诉我的时候,说实话内心十分的激动和意外!目前这本书在京东和当当都有满100-50的活动,感兴趣的朋友欢迎购买阅读,目前该书还没有电子版,所以只能阅读纸质书了!当当购买链接:http://product.dangdang.com/27913798.html京东购买链接:https...
2020-03-02 15:42:18 1004 1
原创 值得收藏 |140+页文章推荐系统系列文章汇总
这里简单说下为什么要写系列的文章,虽然系列的文章很不吃香,阅读率也是惨淡的一笔,可能很多人更爱看的是「标题党」、「八卦文」、「科普文」这样的。但我觉得系列文和技术文是真的很考验作者的,首先要面临惨淡的阅读和稀里哗啦的数据统计,其次要面临的是自己内心的崩溃。但好处是坚持下来,自己写完一个系列,自己的知识体系也就更加完善了,而不是零零散散的没有重点和边际。所以后续的文章大多数还是会以系列文呈现出来,...
2020-01-18 22:54:57 3668 3
原创 浅谈企业如何正确的引入和发展AI算法
本文主要分为上下两部分,(上)部分主要介绍一下企业内部什么时候需要引入AI技术(这里的AI技术泛指机器学习、深度学习、NLP、视觉、语音、推荐等),(下)部分主要介绍一下在引入这些AI技术之后的一些情况和企业的技术方向发展。(上)部分数据积累当一个产品是以内容为主的时候,必然会积累大量的数据,在这个数据为王的时代,有了数据当前要进行分析、挖掘,然后产出更多的商业价值。这个时候必然需要引...
2020-01-04 16:22:08 4359
原创 2019年终总结-埋下的种子是讲给自己的故事
窗外有漆黑的夜,心中是明亮的灯。其实每个人的内心都有一颗属于自己的灯塔,不渡远方的邮轮,不引迷路的灵魂。不知不觉的,时间又过了一年,年初兴高采烈给自己2019立flag的情景还在眼前晃着,一不小心这一年就要彻底沦为过往了。回想过去这一年,许多人匆匆到来,也有很多人悄悄离去,有过好友相聚的狂欢,也有无数捧着孤独无处存放的夜晚,有过收获的满足,也有在崩溃边缘挣扎的心酸,有过山野隔绝的轻松,也有追逐...
2020-01-01 23:17:30 3907 3
原创 常见的五种神经网络(5)-生成对抗网络(下)之GAN、DCGAN、W-GAN
在上一篇文章中介绍了生成模型的基本结构、功能和变分自动编码器,在本篇文章中主要介绍一下生成对抗网络(Generative Adversaarial Networks,GAN)KL散度、JS散度、Wassertein距离KL散度KL散度又称相对熵,信息散度,信息增益。KL散度是两个概率分布P和Q差别的非对称性的度量。在经典境况下,P表示数据的真实分布,Q表示数据的理论分布,模型分布。DK...
2019-12-31 15:54:24 7816 1
原创 常见的五种神经网络(5)-生成对抗网络(上)之变分自动编码器
概率生成模型简称生成模型(Generative Model),是概率统计和机器学习中的一类重要模型,指一系列用于随机生成可观测数据的模型。生成模型的思路是根据可观测的样本学习一个参数化的模型pθ(x)p_{\theta}(x)pθ(x)来近似未知分布pr(x)p_r(x)pr(x),使得生成的样本和真实的样本尽可能的相似。深度生成模型就是利用深层神经网络可以近似任意函数的能力来建模一个复杂的...
2019-12-29 22:33:48 5814
原创 论文|LinUCB论文的思想解读、场景应用与痛点说明
文章目录概述Disjoint LinUCBHybrid LinUCB评估算法实验说明实验位置数据选择特征选择特征降维实验结论注意点LinUCB 的重点场景应用本篇文章主要介绍一下雅虎在2012年发表的论文 【A Contextual-Bandit Approach to Personalized News Article Recommendation】,同时由于最近在做用户留存方面的工作,也涉...
2019-12-23 20:48:47 12981 3
原创 常见的五种神经网络(4)-深度信念网络(下)篇之深度信念网络的原理解读、参数学习
该系列的其他文章:常见的五种神经网络(1)-前馈神经网络常见的五种神经网络(2)-卷积神经网络常见的五种神经网络(3)-循环神经网络(上篇)常见的五种神经网络(3)-循环神经网络(中篇)常见的五种神经网络(3)-循环神经网络(下篇)常见的五种神经网络(4)-深度信念网络(上篇)常见的五种神经网络(4)-深度信念网络(下篇)常见的五种神经网络(5)-生成对抗网络在上一篇文章中介...
2019-12-07 18:02:07 6341 1
原创 Django3.0和Python3.7连接Mysql报:Error loading MySQLdb module. Did you install mysqlclient?
环境说明Python 3.7.3Django 3.0安装:pip3 install -U Django文档:https://docs.djangoproject.com/zh-hans/3.0/contents/项目说明创建项目django-admin startproject mysite 配置MysqlDATABASES = { 'default': {...
2019-12-04 15:45:02 3131
原创 Spark使用Libsvm格式数据构造LabeledPoint格错误:requirement failed:Index 2287 out of bounds for vector of size 27
背景使用libsvm格式的数据构造LabeledPoint格式,例如我的libsvm格式数据如下(索引下标最大值为,3000):790718 1:1 2:1 4:1 5:1 6:1 7:1 9:1 11:1 13:1 16:1 19:1 21:1 28:1 31:1 43:1 64:1 65:1 140:1 164:1 184:1 296:1 463:1 481:1 642:1 813:1 1...
2019-11-29 10:29:22 1491
原创 NLP实战之基于TFIDF的文本相似度计算
TFIDF算法介绍TF-IDF(Term Frequency–InverseDocument Frequency)是一种用于资讯检索与文本挖掘的常用加权技术。TF-IDF的主要思想是:如果某个词或短语在一篇文章中出现的频率TF高,并且在其他文章中很少出现,则认为此词或者短语具有很好的类别区分能力,适合用来分类。TF-IDF实际是TF*IDF,其中TF(Term Frequency)表示词条tt...
2019-11-27 20:14:01 4032
原创 常见的五种神经网络(4)-深度信念网络(上)篇之玻尔兹曼机和受限玻尔兹曼机
引言常见的五种神经网络系列第三篇,主要介绍深度信念网络。内容分为上下两篇进行介绍,本文主要是深度信念网络(上)篇,主要介绍以下内容:背景玻尔兹曼机受限玻尔兹曼机该系列的其他文章:常见的五种神经网络(1)-前馈神经网络常见的五种神经网络(2)-卷积神经网络常见的五种神经网络(3)-循环神经网络(上篇)常见的五种神经网络(3)-循环神经网络(中篇)常见的五种神经网络(3)-循...
2019-11-26 14:32:04 7588 3
原创 美团点评技术与算法文章汇总,设计算法、前后端、客户端、小程序等
这是一份福利贴,先看内容,再看获取方式。算法文章汇总目录:美团“猜你喜欢”深度学习排序模型实践美团大脑:知识图片的建模方法及其应用深度学习在美团搜索广告排序的应用实践美团深度学习系统的工程实践美团餐饮娱乐知识图谱——美团大脑揭秘美团在O2O场景下的广告营销美团外卖骑手背后的AI技术基于TensorFlow Serving的深度学习在线评估强化学习在美团“猜你喜欢的实践”深度...
2019-11-18 20:28:25 2359
原创 机器学习中非常有名的理论或定理你知道几个?
转载请注明出处:http://blog.csdn.net/gamer_gyt博主微博:http://weibo.com/234654758Github:https://github.com/thinkgamer公众号:搜索与推荐Wiki个人网站:http://thinkgamer.github.io在机器学习中,有一些非常有名的理论或定理,对理解机器学习的内在特性非常有帮助。PCA学...
2019-11-16 22:30:20 4435 6
原创 TensorFlow的逻辑回归实现
打开微信扫一扫,关注微信公众号【数据与算法联盟】 转载请注明出处:http://blog.csdn.net/gamer_gyt 博主微博:http://weibo.com/234654758 Github:https://github.com/thinkgamer 逻辑回归我们都知道是用来进行二分类处理的,里边经常用到的阶跃函数是海维塞得阶跃函数(Sig...
2019-11-13 23:22:39 1321
原创 模型的独立学习方式
本篇文章主要介绍一些“模型独立的学习方式”,比如:集成学习、协同学习、自学习、多任务学习、迁移学习、终身学习、小样本学习、元学习等。
2019-11-12 20:53:23 1787
原创 【论文】文本相似度计算方法综述
概述在信息爆炸时代,人们迫切希望从海量信息中获取与自身需要和兴趣吻合度高的内容,为了满足此需求,出现了多种技术,如:搜索引擎、推荐系统、问答系统、文档分类与聚类、文献查重等,而这些应用场景的关键技术之一就是文本相似度计算技术。因此了解文本相似度的计算方法是很有必要的。文本相似度定义文本相似度在不同领域被广泛讨论,由于应用场景不同,其内涵有所差异,故没有统一、公认的定义。Lin从信息论的角度...
2019-11-07 15:55:25 6530 4
原创 无监督学习中的无监督特征学习、聚类和密度估计
无监督学习(Unsupervised Learning)是指从无标签的数据中学习出一些有用的模式,无监督学习一般直接从原始数据进行学习,不借助人工标签和反馈等信息。典型的无监督学习问题可以分为以下几类:无监督特征学习、密度估计、聚类。
2019-11-05 10:58:36 5355
原创 冷启动中的多臂老虎机问题(Multi-Armed Bandit,MAB)
Thompson samplingThompson Sampling是基于Beta分布进行的,所以首先看下什么是Beta分布?Beta分布可以看作是一个概率的概率分布,当你不知道一个东西的具体概率是多少时,他可以给出所有概率出现的可能性。Beta是一个非固定的公式,其表示的是一组分布(这一点和距离计算中的闵可夫斯基距离类似)。比如:二项分布(抛n次硬币,正面出现k次的概率)P(S=k)=...
2019-10-15 10:50:47 5058
原创 神经网络中的网络优化和正则化(三)之超参数优化
公众号标题:神经网络中的优化方法之学习率衰减和动态梯度方向引言神经网络中的网络优化和正则化问题介绍主要分为一,二,三,四篇进行介绍。第一篇包括网络优化和正则化概述优化算法介绍第二篇包括参数初始化数据预处理逐层归一化第三篇包括超参数优化第四篇包括网络正则化无论是神经网络还是机器学习都会存在很多的超参数,在神经网络中,常见的超参数有:网...
2019-09-25 20:53:25 3040 2
原创 神经网络中的网络优化和正则化(二)之参数初始化/数据预处理/逐层归一化
公众号标题:神经网络中的优化方法之参数初始化,数据预处理和逐层归一化引言神经网络中的网络优化和正则化问题介绍主要分为一,二,三,四篇进行介绍。第一篇包括网络优化和正则化概述优化算法介绍第二篇包括参数初始化数据预处理逐层归一化第三篇包括超参数优化第死篇包括网络正则化参数初始化对称权重现象在上一篇文章中我们提到神经网络中的参数学习是基于...
2019-09-22 21:32:55 2352
原创 神经网络中的网络优化和正则化(一)之学习率衰减和动态梯度方向
引言神经网络中的网络优化和正则化问题介绍主要分为上,中,下三篇进行介绍。上篇包括网络优化和正则化概述优化算法介绍中篇包括参数初始化数据预处理逐层归一化超参数优化下篇包括网络正则化概述虽然神经网络有比较强的表达能力,但是应用神经网络到机器学习任务时仍存在一些问题,主要分为:网络优化神经网络模型是一个非凸函数,再加上神经网络中的梯度消失和梯度...
2019-09-22 21:25:01 2208
原创 常见的五种神经网络(3)-循环神经网络(下)篇
引言常见的五种神经网络系列第三种,主要介绍循环神经网络,由于循环神经网络包含的内容过多,分位上中下三篇进行介绍,本文主要是循环神经网络(下)篇,主要介绍以下内容:长短时记忆网络(LSTM)门控循环单元网络(GRU)递归循环神经网络(RecNN)图网络(GN)该系列的其他文章:常见的五种神经网络(1)-前馈神经网络常见的五种神经网络(2)-卷积神经网络常见的五种神经网络(3)...
2019-09-18 08:14:54 3275
原创 常见的五种神经网络(3)-循环神经网络(中)篇
引言常见的五种神经网络系列第三种,主要介绍循环神经网络,分位上中下三篇进行介绍,本文主为(中)篇,涉及内容如下:循环神经网络中的参数学习RNN中的长期依赖问题常见的循环神经网络结构该系列的其他文章:常见的五种神经网络(1)-前馈神经网络常见的五种神经网络(2)-卷积神经网络常见的五种神经网络(3)-循环神经网络(上篇)常见的五种神经网络(3)-循环神经网络(中篇)常见的五...
2019-09-11 01:16:12 4837
原创 常见的五种神经网络(3)-循环神经网络(上)篇
引言常见的五种神经网络系列第三篇,主要介绍循环神经网络,由于循环神经网络包含的内容过多,分位上下两篇进行介绍,本文主要是循环神经网络(上)篇,主要介绍以下内容:循环神经网络概述如何给神经网络增加记忆能力什么是循环神经网络单向循环神经网络深度循环神经网络循环神经网络应用到机器学习任务循环神经网络中的参数学习该系列的其他文章:常见的五种神经网络(1)-前馈神经网络常见的五种...
2019-09-08 16:37:58 10139 2
原创 常见的五种神经网络(2)-卷积神经网络
文章目录卷积的概念一维卷积二维卷积互相关常见的卷积核及特征常见的卷积核卷积核的特征卷积的变种卷积的数学性质交换性导数卷积神经网络用卷积代替全连接卷积层汇聚层全连接层典型的卷积网络结构参数学习误差项的计算卷积层汇聚层几种典型的卷积神经网络LeNet-5AlexNetInception残差网络其他卷积方式转置卷积空洞卷积卷积神经网络(Convolutional Neural Network)是一...
2019-09-05 18:05:24 9239 14
原创 论文|RecSys18-序列推荐模型 TransFM(Translation-based Factorization Machines for Sequential Recommendation)
转载请注明出处:https://blog.csdn.net/Gamer_gyt/article/details/95014206博主微博:http://weibo.com/234654758Github:https://github.com/thinkgamer公众号:搜索与推荐Wiki序列推荐模型 Translation-based Recommendation参考:点击阅读概述论...
2019-08-31 09:14:39 2828
原创 论文|RecSys17-序列推荐模型 Translation-based Recommendation
论文名字:基于翻译的序列推荐方法下载地址:https://arxiv.org/pdf/1707.02410.pdf背景这篇论文是由 Ruining He,Wang-Cheng Kang和Julian McAuley三位大佬提出的,在2017年的ACM推荐系统会议(RecSys’17)上获得了最佳论文奖(在大佬主页可以下载该论文中涉及的代码和数据集,可惜代码是C++写的,不懂C++的童鞋挑战...
2019-08-29 08:19:12 3866
原创 Spark排序算法系列之ALS模型实现
在上一篇文章中介绍了ALS算法的原理([点击阅读](https://blog.csdn.net/Gamer_gyt/article/details/98897829)),在这篇文章中主要介绍一下ALS算法在Spark中的实现。
2019-08-13 14:27:45 3184 1
原创 基于协同的ALS算法原理介绍与实现
ALS也是一种协同算法,其全称是交替最小二乘法(Alternating Least Squares),由于简单高效,已被广泛应用在推荐场景中,目前已经被集成到Spark MLlib和ML库中,在下一篇文章会对其使用方式进行详细介绍,本篇文章主要介绍ALS的底层算法原理。最小二乘法(Least Squares)在介绍ALS算法之前,先来了解LS,即最小二乘法。LS算法是ALS的基础,是一种数...
2019-08-08 23:41:20 2856
原创 论文|基于三部图网络结构的知识推荐算法
该论文是北京一高校学生的论文,其主要是基于用户-物品-标签这样的三部图网络展开描述的。下面主要介绍一些其中提出的可用的点,其余的详细介绍可参考原文章。背景推荐算法是个性化推荐的核心,现有的推荐算法(除了点击率预估之外的)包括:基于内容的推荐算法基于项目的协同过滤算法基于用户的协同过滤算法基于模型的协同过滤算法基于社会网络分析方法的算法基于网络结构的推荐算法基于网络结构的推...
2019-08-05 22:43:48 3684 1
原创 基于协同的Slope One算法原理介绍和实现
该篇文章主要介绍Slope One算法。Slope One 算法是由 Daniel Lemire 教授在 2005 年提出的一个 Item-Based 的协同过滤推荐算法。和其它类似算法相比, 它的最大优点在于算法很简单, 易于实现, 执行效率高, 同时推荐的准确性相对较高。协同过滤算法理解和Python实现基于标签的推荐算法基于图的推荐算法经典的ItemCF的问题经典的基于物品...
2019-08-02 16:45:53 2191 8
原创 【技术分享】你想知道的网易云音乐推荐架构解析,都在这里!
本文选自网易云音乐推荐算法负责人-肖强前辈在全球人工智能峰会上的分享,主要介绍了三方面:关于网易云音乐,AI算法在音乐推荐中的应用和AI场景下的音乐思考。这里拿来分享给大家,并加上自己的理解,希望对大家有所帮助。首先说明我是网易云音乐的深度用户,目前级别LV9,每天都会去听日推。喜欢网易云音乐的原因不仅是友好的用户交互设计,而且还是因为在网易云音乐中能看到一个个陌生的故事。...
2019-08-01 01:17:24 4094 6
原创 【技术分享】美团外卖的商业变现的技术思考和实践
本文选自美团-王永康前辈在全球人工智能峰会上的分享,主要介绍了四方面:业务介绍,平台侧收入优化,商家侧转化优化和用户侧体验优化。这里拿来分享给大家,并加上自己的理解,希望对大家有所帮助。本文将从四个方面介绍美团外卖商业变现实践: 业务介绍 平台侧:收入优化 商家侧:转化优化 用户侧:体验优化 业务介绍首先介绍了美团外卖的业务情况,其包含了外卖商家...
2019-08-01 00:55:31 2774
原创 Spark MLlib 之 数据类型与大规模数据集的相似度计算原理探索
最近小编在做的是计算两两用户的粉丝重合度,根据粉丝重合度去评估两个用户之间的相似度,根据条件进行过滤之后大概有3000个用户,但每个用户的粉丝量参差不齐,有上百万的,有几千的,这样在去构建笛卡尔积的时候,进行粉丝数据关联,得到的用户集就会特别大,spark运行的时候就会很慢,而且会出现很严重的数据倾斜。这个时候了解到了spark支持的数据类型,看到了CoordinateMatrix,然后深究其原理,便看到了这篇文章,经过整理形成了此文。
2019-07-29 15:41:15 2016 1
原创 《推荐系统开发实战》之业内推荐系统架构介绍
转载请注明出处:http://blog.csdn.net/gamer_gyt博主微博:http://weibo.com/234654758Github:https://github.com/thinkgamer公众号:搜索与推荐Wiki个人网站:http://thinkgamer.github.io不管是电商网站,还是新闻资讯类网站,推荐系统都扮演着十分重要的角色。一个优秀的推荐系统...
2019-07-20 08:38:45 3668
原创 《推荐系统开发实战》之三大案例带你从0到1自己实现一个推荐系统
转载请注明出处:http://blog.csdn.net/gamer_gyt博主微博:http://weibo.com/234654758Github:https://github.com/thinkgamer公众号:搜索与推荐Wiki个人网站:http://thinkgamer.github.io俗话说的好:“眼看千遍,不如手写一遍”,前几篇介绍了推荐系统的来源、发展、数据预处理、...
2019-07-20 08:38:08 10329 16
原创 《推荐系统开发实战》之效果评估
转载请注明出处:http://blog.csdn.net/gamer_gyt博主微博:http://weibo.com/234654758Github:https://github.com/thinkgamer公众号:搜索与推荐Wiki个人网站:http://thinkgamer.github.io推荐系统的评估方法分为用户调研、在线评估和离线评估。用户调研推荐系统的离线实验指...
2019-07-19 08:18:07 3152
原创 《推荐系统开发实战》之冷启动介绍与解决
转载请注明出处:http://blog.csdn.net/gamer_gyt博主微博:http://weibo.com/234654758Github:https://github.com/thinkgamer公众号:搜索与推荐Wiki个人网站:http://thinkgamer.github.io推荐系统基于用户大量的历史行为做出事物呈现,因此用户的历史行为数据是构建一个优质推荐系...
2019-07-18 22:37:44 2439
word2vec.zip
2019-11-13
NLP汉语自然语言处理原理与实战
2018-06-15
gephi-0.9.1-windows.exe
2017-02-14
mysql-connector-java-5.0.4-bin.jar
2017-02-14
commons-el-1.0.jar,jasper-compiler.jar,jasper-runtime.jar
2016-07-28
从疝气病症预测病马的死亡率的测试数据集
2016-04-25
十大算法之线性查找算法
2015-07-29
securboot未完全配置消除补丁
2014-08-23
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人