自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

十三

欢迎关注微信公众号:算法工程师面试那些事儿

  • 博客(32)
  • 资源 (20)
  • 收藏
  • 关注

转载 爱奇艺个性化推荐排序实践

文章转自:https://mp.weixin.qq.com/s/lUP2BehOh7KczR3WRnOqFw在当前这个移动互联网时代,除了专业内容的丰富,UGC内容更是爆发式发展,每个用户既是内容的消费者,也成为了内容的创造者。这些海量的内容在满足了我们需求的同时,也使我们寻找所需内容更加困难,在这种情况下个性化推荐应运而生。个性化推荐是在大数据分析和人工智能技术的基础上,通过研究用户的兴趣偏好...

2018-10-30 19:22:48 422

转载 一文读懂推荐系统

1. 推荐系统的3个W1.1 是什么(What is it?)推荐系统就是根据用户的历史行为、社交关系、兴趣点、所处上下文环境等信息去判断用户当前需要或感兴趣的物品/服务的一类应用。1.2 为什么(Why is that?)为什么我们要用到推荐系统呢?随着信息技术和互联网的发展,人类从信息...

2018-10-29 15:42:25 1826

转载 今日头条推荐算法原理解析

转自:https://blog.csdn.net/ScarlettYellow/article/details/80458075?utm_source=blogxgwz2 ,谢谢原作者这么精简的总结。 Abstract:这篇是1月份头条首次公开的算法原理的笔记记录。1.头条推荐算法原理1.1 系统概览1.资讯推荐系统”你关心的,才是头条“本质要解决的问题:用户、环...

2018-10-29 15:37:03 8631

原创 基于内容相似度的推荐与TF-IDF算法

1 基于内容相似度的推荐注:为尊重大佬,博文第一部分来自:https://blog.csdn.net/qq_32690999/article/details/77434381 ,这篇文章一定要读一下,非常赞!1.1概念基于内容相似度的推荐就是把与你喜欢看的新闻内容相似新闻推荐给你。基于内容的推荐算法的主要优势在于无冷启动问题,只要用户产生了初始的历史数据,就可以开始进行推荐的计算。而且随着用...

2018-10-29 09:35:18 9731

原创 项亮《推荐系统实战》思维导图

最近拜读了项亮博士的《推荐系统实战》,收获很大,整理了一系列的博客。将各章节的链接放在下面,欢迎查看、交流。本文主要总结了1-6章的主要思路,并思维导图绘制。《推荐系统实战》、《集体智慧编程》、思维导图第一章 好的推荐系统第二章 利用用户行为数据第三章 推荐系统冷启动问题第四章 利用用户标签数据第五章 利用上下文信息第六章 利用社交网络数据第七章 推荐系统第八章 评分预测问题第...

2018-10-28 16:02:04 3961

原创 推荐系统之隐语义模型(LFM)及Python实现

核心思想隐语义模型LFM和LSI,LDA,Topic Model其实都属于隐含语义分析技术,是一类概念,他们在本质上是相通的,都是找出潜在的主题或分类。这些技术一开始都是在文本挖掘领域中提出来的,近些年它们也被不断应用到其他领域中,并得到了不错的应用效果。比如,在推荐系统中它能够基于用户的行为对item进行自动聚类,也就是把item划分到不同类别/主题,这些主题/类别可以理解为用户的兴趣。对于...

2018-10-27 22:24:15 7112 10

原创 基于图的推荐算法及Python实现(PersonalRank)

使用随机游走算法PersonalRank实现基于图的推荐。二部图在推荐系统中,用户行为数据可以表示成图的形式,具体来说是二部图。用户的行为数据集由一个个(u,i)二元组组成,表示为用户u对物品i产生过行为。本文中我们认为用户对他产生过行为的物品的兴趣度是一样的,也就是我们只考虑“感兴趣”OR“不感兴趣”。假设有下图所示的行为数据集。其中,users集U={A, B, C},items集I ...

2018-10-27 19:05:59 3472 1

原创 基于物品的协同过滤算法

基于物品的协同过滤,ItemCF,ItemCollaborationFilter,核心思想给用户推荐那些和他们之前喜欢的物品相似的物品。比如,用户A之前买过《数据挖掘导论》,该算法会根据此行为给你推荐《机器学习》,但是ItemCF算法并不利用物品的内容属性计算物品之间的相似度,它主要通过分析用户的行为记录计算物品之间的相似度。算法认为,物品A和物品B具有很大的相似度是因为喜欢物品A的用户大...

2018-10-25 20:53:40 12167

原创 Python处理文件相关操作

open() 方法Python open() 方法用于打开一个文件,并返回文件对象,在对文件进行处理过程都需要使用到这个函数,如果该文件无法被打开,会抛出 OSError。注意:使用 open() 方法一定要保证关闭文件对象,即调用 close() 方法。open() 函数常用形式是接收两个参数:文件名(file)和模式(mode)。完整的语法格式为:open(file, mode='r...

2018-10-25 19:25:05 283

原创 读书笔记《推荐系统实战》| 评分预测问题

《推荐系统实战》这本书的下载地址:《推荐系统实战》第一章 好的推荐系统第二章 利用用户行为数据第三章 推荐系统冷启动问题第四章 利用用户标签数据第五章 利用上下文信息第六章 利用社交网络数据第七章 推荐系统前面介绍的推荐系统都是TOPN推荐问题,其实推荐系统在理论研究中比较重要的话题是评分预测问题。8.1 离线实验方法首先将给定的数据集划分为训练集和测试集,然后根据训练集建立用...

2018-10-25 16:21:05 1494 1

转载 智能推荐系统开发中的十大要素

**智能推荐系统充分运用了机器学习、数据挖掘、搜索引擎、自然语言处理等相关领域的技术。**但推荐系统并不神秘,事实上,推荐在我们身边无处不在。对广 大软件开发工程师们来说,能够投身于推荐系统的研发,是一件既有趣又充满挑战的工作。想要成功的开发一套效果良好的推荐系统,有一系列值得重视的关键点, 文本对此进行了总结,具体列举如下。1 充分运用显式\隐式反馈数据数据是一切推荐系统的基础。良好的推荐效...

2018-10-25 09:29:26 7384

转载 推荐系统参考资料

列了一些之前设计开发百度关键词搜索推荐引擎时, 参考过的论文, 书籍, 以及调研过的推荐系统相关的工具;同时给出参加过及未参加过的业界推荐引擎应用交流资料(有我网盘的链接), 材料组织方式参考了厂里部分同学的整理。因为推荐引擎不能算是一个独立学科,它与机器学习,数据挖掘有天然不可分的关系,所以同时列了一些这方面有用的工具及书籍,希望能对大家有所帮助。也方便自己查阅 ^_^注:2018年...

2018-10-25 08:30:56 3894 1

转载 一个完整推荐系统的设计实现-以百度关键词搜索推荐为例

在之前一篇博文中, 有同学在评论中问了个问题: 如何解决因式分解带来的推荐冷门,热门关键词的问题。 在回答这个问题的时候, 想到了近几年在做搜索推荐系统的过程中, 学术界和工业界的一些区别。 正好最近正在做技术规划, 于是写偏文章说下工业界完整推荐系统的设计。结论是: 没有某种算法能够完全解决问题, 多重算法+交互设计, 才能解决特定场景的需求。下文也对之前的一些博文进行梳理,构成...

2018-10-24 22:22:38 5369

转载 探寻微博背后的大数据原理:微博推荐算法简述

“We are leaving the age of information and entering the age of recommendation” — Chris Anderson in The Long Tail。我们正在远离信息,而进入推荐时代。——克里斯·安德森  在介绍微博推荐算法之前,我们先聊一聊推荐系统和推荐算法。有这样一些问题:推...

2018-10-24 21:53:39 6338

原创 基于用户的协同过滤算法

基本思想俗话说“物以类聚、人以群分”,拿看电影这个例子来说,如果你喜欢《蝙蝠侠》、《碟中谍》、《星际穿越》、《源代码》等电影,另外有个人也都喜欢这些电影,而且他还喜欢《钢铁侠》,则很有可能你也喜欢《钢铁侠》这部电影。所以说,当一个用户 A 需要个性化推荐时,可以先找到和他兴趣相似的用户群体 G,然后把 G 喜欢的、并且 A 没有听说过的物品推荐给 A,这就是基于用户的系统过滤算法。原理根据...

2018-10-24 20:36:37 11522 4

原创 python | random.seed()

random1、不设置seed,每次的输出都不同,随机的>>>import random>>> random.randint(1,10)10>>> random.randint(1,10)9>>> random.randint(1,10)3>>> random.randint(1,1

2018-10-24 19:57:22 372

转载 推荐算法分类

推荐算法具有非常多的应用场景和商业价值,因此对推荐算法值得好好研究。推荐算法种类很多,但是目前应用最广泛的应该是协同过滤类别的推荐算法,本文就对协同过滤类别的推荐算法做一个概括总结,后续也会对一些典型的协同过滤推荐算法做原理总结。1. 推荐算法概述推荐算法是非常古老的,在机器学习还没有兴起的时候就有需求和应用了。概括来说,可以分为以下5种:1)基于内容的推荐:这一类一般依赖于自然语言处理NL...

2018-10-24 15:25:11 5929 1

原创 读书笔记《推荐系统实战》| 推荐系统

在实际系统中,数据结构不一样,需要根据不同的数据设计推荐算法,并将这些算法融合到一个系统中。本章将首先介绍推荐系统的外围架构(推荐系统要与网站的其他系统进行对接),然后介绍推荐系统的架构,并对架构中的每个模块的设计进行深入讨论。7.1 推荐系统外围的架构主要组成部分:一般来说,每个网站都有一个UI系统,负责给用户展示并与用户进行交互。网站会通过日志系统将用户在UI的各种各样的行为记录到用...

2018-10-24 11:24:36 1017

原创 某购物网站推荐系统实现 | 数据库、推荐算法

https://github.com/weizhiwen/flask_wykl_apiMYSQL数据库配置文件config.pyHOST = 'localhost'USER = 'root'PASSWORD = '123456'DATABASE = 'llllll'数据库操作文件db.py分析import pymysql # 数据库用的My...

2018-10-24 09:57:55 9255 1

原创 读书笔记《推荐系统实战》| 利用社交网络数据

美国著名的第三方调查机构尼尔森调查了影响用户相信某个推荐结果的因素,90%的用户相信朋友对他们的推荐。基于社交网络的推荐可以很好的模拟现实社会。所以利用社交网络数据进行推荐可以增加用户对系统的信任度。另外利用用户在社交网络的数据可以解决冷启动问题。6.1 获取社交网络数据的途径主要方式:电子邮件(联系人);用户的注册信息(居住地和工作地);用户的位置信息(网页的IP和手机的GPS);论坛...

2018-10-24 08:39:34 673

原创 python | 字典相关知识总结

什么是字典?字典是Python语言中唯一的映射类型。映射类型对象里哈希值(键,key)和指向的对象(值,value)是一对多的关系,通常被认为是可变的哈希表。字典对象是可变的,它是一个容器类型,能存储任意个数的Python对象,其中也可包括其他容器类型。字典类型与序列类型的区别:1.存取和访问数据的方式不同;2.序列类型只用数字类型的键(从序列的开始按数值顺序索引);3.映射类型可以...

2018-10-22 19:36:01 273

原创 读书笔记《推荐系统实战》| 利用上下文信息

无论是基于用户动作行为数据还是用户标签行为数据,都忽略了一个很重要的内容:用户当时所处的上下文。用户访问系统所处的时间、地点、心情等,对推荐结果影响很大。心情的获取,可以让用户登录系统的时候,让其选择,根据选择的心情为其进行推荐。本章主要考虑时间和地点上下文。5.1 时间上下文信息时间信息对用户兴趣的影响:用户兴趣是变化的(年龄段、职业等);物品也是有生命周期的(电影,新闻等);季节效应...

2018-10-17 10:59:05 515

原创 读书笔记 | 《基于tensorflow的深度在学习—揭示数据隐含的奥秘》

第一章 入门知识1.tf.Sessson 与 tf.InteractiveSessiontf.InteractiveSession():它能让你在运行图的时候,插入一些计算图,这些计算图是由某些操作(operations)构成的。这对于工作在交互式环境中的人们来说非常便利,比如使用IPython。tf.Session():需要在启动session之前构建整个计算图,然后启动该计算图。意思...

2018-10-14 16:57:00 310

原创 读书笔记《推荐系统实战》| 利用用户标签数据

前面介绍的CF算法,利用的是用户的行为数据,就是用户对商品的动作,为了区别本章内容,称之为用户动作行为数据。在介绍商品冷启动时,提到了利用商品的内容信息计算商品间的相似度。本章介绍另外一种数据:用户标签行为数据。就是人为的添加的标签,比如用户对看的一部电影打标签,写博客时作者给博客打的标签。标签分两种:一种是作者或者专家给商品打标签,一种是普通用户对商品打标签。后者被称为UGC。商品的内容...

2018-10-13 08:43:46 1205

原创 Linux命令

ls# 列举当前路径下的所有文件及文件夹ls# 查看当前路径下的是啥?文件还是文件夹。-表示文件,d表示文件夹ls -l# 查看某一文件夹下的文件ls /user/# 查看上一个路径的文件夹下有啥ls ../# 查看所有文件,包含隐藏文件ls -a# 查看文件ls -alh# 显示所有Python文件ls *.py#显示所有以1开头的文件ls 1*...

2018-10-11 20:11:19 186

原创 读书笔记《推荐系统实战》| 推荐系统冷启动问题

本人将《推荐系统实战》放在了资源里,如有需要请前往下载。3.1 冷启动问题简介冷启动问题的解决方案:提供非个性化的推荐。为新注册用户推荐热门的商品,等用户数据搜集到一定程度后,切换到个性化推荐;利用用户注册时提供的年龄性别等数据做粗粒度的个性化;要求用户在登录时对一些商品进行反馈,然后给用户推荐那些与反馈结果好的商品相似的商品;利用用户的社交网络登录,导入用户在社交网络的好友信息...

2018-10-10 10:54:42 725

原创 tf.nn.top_k()与tf.nn.in_top_k()区别

tf.nn.top_k(input, k, name=None)这个函数的作用是返回 input 中每行最大的 k 个数,并且返回它们所在位置的索引。import tensorflow as tfimport numpy as npinput = tf.constant(np.random.rand(3,4))k = 2output = tf.nn.top_k(input, k)...

2018-10-09 10:15:31 1847

原创 读书笔记《推荐系统实战》| 利用用户行为数据

2 利用用户行为数据为了给用户进行物品推荐,首先必须得了解用户的兴趣爱好,一般用户会在注册时给自己打标签。但是利用用户注册信息为用户进行推荐是不合理的:现有的自然语言处理技术不能很好的对用户的自我描述进行准确的理解;用户的兴趣会发生变化,但是却不会动态的更新自我描述;用户自己也知道怎么用语言去表达自己的兴趣爱好,或者不知道自己的爱好;所以我们要根据用户的历史行为对用户进行建模。2.1 用户行为...

2018-10-08 10:36:53 2317

原创 读书笔记《推荐系统实战》| 好的推荐系统

1、长尾理论是指,只要产品的存储和流通的渠道足够大,需求不旺或销量不佳的产品所共同占据的市场份额可以和那些少数热销产品所占据的市场份额相匹敌甚至更大,即众多小市场汇聚成可产生与主流相匹敌的市场能量。2、几乎所有的推荐系统应用都是由前台的展示页面、后台的日志系统以及推荐算法系统3部分构成。3、电子商务——>亚马逊最主要的应用有个性化商品推荐列表和相关商品的推荐列表。推荐结果的标题、缩...

2018-10-07 09:31:53 7743 3

原创 推荐机制初探

推荐引擎的分类推荐引擎的分类可以根据很多指标,下面我们一一介绍一下:推荐引擎是不是为不同的用户推荐不同的数据根据这个指标,推荐引擎可以分为基于大众行为的推荐引擎和个性化推荐引擎根据大众行为的推荐引擎,对每个用户都给出同样的推荐,这些推荐可以是静态的由系统管理员人工设定的,或者基于系统所有用户的反馈统计计算出的当下比较流行的物品。个性化推荐引擎,对不同的用户,根据他们的口味和喜好给出更加精...

2018-10-06 17:34:19 611

原创 Tensorflow | 深度学习——>学习资源不断更新

1、Udacity主要讲了Softmax、CNN、RNN、LSTM用Tensorflow实现。课程作业及答案2、TensorFlow 官方文档中文版

2018-10-05 16:30:10 171

原创 从深度学习入门Tensorflow

Softmax实现MNIST识别import tensorflow as tffrom tensorflow.examples.tutorials.mnist import input_data# 加载数据mnist = input_data.read_data_sets("MNIST_data", one_hot=True)# None表示输入任意数量的MNIST图像,每一张图展平成7...

2018-10-04 14:32:59 231

tensorflow-DeepFM-master.zip

DeepFM作为比较新的推荐模型,某些方面优于PNN、FNN、Wide&Deep;模型。该文档包含DeepFM模型python代码。还包括一个实例。

2019-03-22

wide&deep;.zip

wide&deep;相关论文,以及以泰坦尼克号作为实例,进行应用验证。

2019-02-24

LDA主题模型.zip

LDA(Latent Dirichlet Allocation)中文翻译为:潜在狄利克雷分布。LDA主题模型是一种文档生成模型,是一种非监督机器学习技术。它认为一篇文档是有多个主题的,而每个主题又对应着不同的词。一篇文档的构造过程,首先是以一定的概率选择某个主题,然后再在这个主题下以一定的概率选出某一个词,这样就生成了这篇文档的第一个词。不断重复这个过程,就生成了整篇文章。

2019-01-05

推荐相关.zip

最近拜读了项亮博士的《推荐系统实战》,收获很大,整理了一系列的博客。欢迎查看、交流。本资源主要总结了1-6章的主要思路,并思维导图绘制。还有《集体智慧编程》、《推荐系统实战》两本书。

2018-10-28

精益数据分析1.pdf

本书展示了如何验证自己的设想、找到真正的客户、打造能赚钱的产品,以及提升企业知名度。30多个案例分析,全球100多位知名企业家的真知灼见,为你呈现来之不易、经过实践检验的创业心得和宝贵经验,值得每位创业家和企业家一读。

2018-10-14

集体智慧编程.pdf

本书以机器学习与计算统计为主题背景,专门讲述如何挖掘和分析Web上的数据和资源,如何分析用户体验、市场营销、个人品味等诸多信息,并得出有用的结论,通过复杂的算法来从Web网站获取、收集并分析用户的数据和反馈信息,以便创造新的用户价值和商业价值。

2018-10-14

推荐系统实践.pdf

《推荐系统实践》这本书对于推荐系统的各个方面介绍地很详细,如果你认为自己是推荐系统领域的专业人员,那么书中的每一个点都必须得会,最起码得知道;如果你正在全面地学习推荐系统,这本书是一个非常好的由浅入深的教材。如果你是一个学校里的科研人员,你可以在里面看到熟悉的数学模型,而且可以看到具体实施到实际生产需要解决哪些问题;如果你是一个公司里的实战人员,你可以看到熟悉的代码来理解作者表达的意思,而且也可以看到一个问题时如何用数学模型去解决的;

2018-10-10

精益数据分析.pdf

精益数据分析 如果需要其他数据分析资料(书籍、代码)请留言

2018-10-09

VS10-MFC编程.docx

比较详细的介绍了MFC的安装,使用,通过例子进行学习,分分钟学会

2018-04-13

受限玻尔兹曼机笔记.pdf

本文包括RBM的所有基础知识。代码可以见hinton的文章 玻尔兹曼机(BMS)是一种特殊的对数线性马尔可夫随机场(MRF)的形式,即,其能量函数在其自由参数的线性空间里。使他们强大到足以代表复杂的分布,我们考虑到一些变量是没有观察到(他们称为隐藏)。通过更多的隐藏变量(也称为隐藏的单位),我们可以增加的玻尔兹曼机的建模能力(BM)。受限玻尔兹曼机进一步限制BMS中那些可见-可见和隐藏-隐藏的连接。本文是一个RBM的描述。

2018-04-11

支持向量机.docx

希望哟帮助 谢谢 加油!

2018-04-02

朴素贝叶斯.docx

希望对大家有帮助。加油。 加油!

2018-04-02

k-means数据

k-means数据 机器学习 加油

2018-03-14

deeplearning学习

deeplearning学习,吴恩达 网盘地址

2018-03-14

Logistic regression.rar

针对《机器学习实战》,logistics回归python代码,知识点,疝气病症预测病马死亡率测试集训练集

2018-01-14

python入门笔记(强烈推荐).pdf

python刚刚开始学习还没入门的,可以试一下这些例题,掌握快速

2017-12-21

datingTestSet2.txt

KNN数据集,约会网站配对效果 欢迎下载

2017-12-18

隐形眼镜数据集

决策树数据集

2017-12-18

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除