自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(20)
  • 收藏
  • 关注

原创 DIN

DIN的出发点在于如果用户的历史购买记录中有类似的商品,那么广告推荐在处理用户序列数据时,应该着重注意这些相似的商品或者说有关联的商品。这种着重注意体现在注意力机制,模型应该自适应的去捕捉用户的兴趣变化,注意力其实也就是权重的加权,DIN设计了一个 local activation unit,利用候选商品和历史问题商品之间的相关性计算出权重。这里面是一个前馈神经网络,输入是用户历史行为商品和当前的候选商品, 输出是它俩之间的相关性, 这个相关性相当于每个历史商品的权重,把这个权重与原来的历史行为embedd

2021-03-27 23:42:26 108

原创 NFM

FM利用交叉特征的思路如果引申到二阶以上会因为组合爆炸问题导致权重数量和训练复杂度过高。理论上神经网络可以逼近任意复杂的函数,如果利用深度学习将二项交叉的部分替换成f(x),则可以解决这个局限性。NFM的具体结构:这个结构中最为特殊的部分就是Bi-Interaction Pooling layer特征交叉池化层,用数学表达式来表达这层网络结构:fBI(Vx)=∑i=1n∑j=i+1nxivi⊙xjvjf_{B I}\left(\mathcal{V}_{x}\right)=\sum_{i=1}^{

2021-03-24 21:54:32 99

原创 DeepFM

这里写自定义目录标题逻辑回归(LR):更多考虑线性特征,缺少特征交叉性和高阶特征DNN:考虑了高阶特征,缺少了对于低阶特征的考虑CNN:考虑近邻特征的关系。较单一,适合图片分类RNN:考虑更多的是数据时序性,较单一FM:考虑更多低阶特征,缺少高阶特征Wide&Deep:同时考虑了低阶特征和高阶特征,但是低阶特征需要手动交叉生成,对用户不友好DeepFM:兼顾了低阶和高阶特征,且计算过程中不需要用户干预DeepFM的架构可以

2021-03-21 23:35:18 104 1

原创 推荐系统模型--Wide&Deep

推荐系统模型–Wide&Deep为了加强模型的泛化能力,研究者引入了DNN结构,将高维稀疏特征编码为低维稠密的Embedding vector,这种基于Embedding的方式能够有效提高模型的泛化能力。但是,基于Embedding的方式可能因为数据长尾分布,导致长尾的一些特征值无法被充分学习,其对应的Embedding vector是不准确的,这便会造成模型泛化过度...

2021-03-18 22:42:56 168

原创 推荐系统模型-deep crossing

Deep Crossing模型的应用场景是微软搜索引擎Bing中的搜索广告推荐场景。用户在搜索引擎中输入搜索词之后,搜索引擎除了会返回相关结果,还会返回与搜索词相关的广告。尽可能地增加搜索广告的点击率,准确地预测广告点击率,并以此作为广告排序的指标之一,是非常重要的工作,也是Deep Crossing模型的优化目标。微软使用的特征如下表所示,这些特征可以分为三类:一类是可以被处理成one-hot或者multi-hot向量的类别型特征,包括用户搜索词(query)、广告关键词(keyword)、广告标题(t

2021-03-16 23:42:33 127

原创 Task05 天池新闻推荐入门赛之【排序模型+模型融合】

DIN,Deep Interest Network,深度兴趣网络。论文的关键在于对用户历史行为的embedding向量的改进。模型结构如下:左边是一般的深度推荐模型,basemodel,basemodel就是将用户特征,进行sum pooling输入给全连接层,和sigmoid函数得到一个输出的结果;右边则是DIN模型。利用注意力机制对用户的兴趣进行进行一个加权最后再使用一个sum pooling。其中,va代表的是候选广告的嵌入向量,ej是用户历史中的兴趣;通过注意力机制来表示用户对于不同历史信

2020-12-06 21:32:18 233

原创 特征工程

这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入占坑欢迎使用Markdown编辑器你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用

2020-12-03 23:58:00 113

原创 Task03 天池新闻推荐入门赛之【多路召回】

Task03 天池新闻推荐入门赛之【多路召回】多路召回所谓的“多路召回”策略,就是指采用不同的策略、特征或简单模型,分别召回一部分候选集,然后把候选集混合在一起供后续排序模型使用,可以明显的看出,“多路召回策略”是在“计算速度”和“召回率”之间进行权衡的结果。其中,各种简单策略保证候选集的快速召回,从不同角度设计的策略保证召回率接近理想的状态,不至于损伤排序效果。如下图是多路召回的一个示意图,在多路召回中,每个策略之间毫不相关,所以一般可以写并发多线程同时进行,这样可以更加高效。冷启动问题冷启动问题

2020-11-30 23:18:05 91

原创 Task02:数据分析(2天)

做过数学建模的人应该比较了解,在建模之前第一步应该是反复读题,再对数据预处理之后寻找合适的模型与方法解决问题。数据分析常用的包有pandas,numpy,seaborn等等,task2没有什么难度,一点点跟着做就可以了原链接如下:天池新闻推荐入门赛之数据分析...

2020-11-27 23:27:45 81

原创 datawhale 推荐系统(新闻推荐)天池新闻推荐入门赛之【赛题理解+Baseline】Task01

遇到的问题1.服务器上直接用wget 网址的方式下载天池数据失败,baseline采用了传统的CF协同过滤技术,协同过滤的特点就是完全没有利用到物品本身或者是用户自身的属性, 仅仅利用了用户与物品的交互信息就可以实现推荐,比较简单高效, 但这也是它的一个短板所在, 由于无法有效的引入用户年龄, 性别,商品描述,商品分类,当前时间,地点等一系列用户特征、物品特征和上下文特征, 这就造成了有效信息的遗漏,不能充分利用其它特征数据。具体代码:```python# import packagesimp

2020-11-25 23:24:24 285

原创 2020-09-17

2020年第十七届中国研究生数学建模竞赛赛题A题:华为题_芯片相噪算法设计B题:汽油辛烷值建模C题:面向康复工程的脑电信号分析和判别模型D题:无人机集群协同对抗E题:能见度估计与预测F题:飞行器质心平衡供油策略优化百度网盘链接:https://pan.baidu.com/s/1C_AGvMxrojaU-rCvl5w9Iw百度网盘文件提取码:2020赛题解压码:2020HDligong16520...

2020-09-17 09:47:01 2658

原创 2020-08-10

文件与文件系统打开文件open(file, mode=‘r’, buffering=None, encoding=None, errors=None, newline=None, closefd=True) Open file and return a stream. Raise OSError upon failure.file: 必需,文件路径(相对或者绝对路径)。mode: 可选,文件打开模式buffering: 设置缓冲encoding: 一般使用utf8errors: 报错级别.

2020-08-10 21:45:41 239

原创 15. 模块

模块和datetime模块练习题:1、怎么查出通过 from xx import xx导⼊的可以直接调⽤的⽅法?help()2、了解Collection模块,编写程序以查询给定列表中最常见的元素。题目说明:输入:language = [‘PHP’, ‘PHP’, ‘Python’, ‘PHP’, ‘Python’, ‘JS’, ‘Python’, ‘Python’,‘PHP’, ‘Python’]输出:Python"""Input filelanguage = ['PHP', 'PHP',

2020-08-07 22:41:14 107

原创 类与对象以及魔法方法打卡

类与对象:1、以下类定义中哪些是类属性,哪些是实例属性?class C: num = 0 def __init__(self): self.x = 4 self.y = 5 C.count = 6num = 0、C.count = 6 为类的属性,self.x=4、 self.y=5 为实例属性2、怎么定义私有⽅法?函数名前加上“__”两个下划线3、尝试执行以下代码,并解释错误原因:class C: def myFun

2020-08-05 22:05:08 173

原创 python打卡第四次

字典列表序列

2020-07-31 11:45:32 91

原创 Python打卡第四天,列表,元组

Python打卡第四天,列表,元组操作题没看完,明天继续列表列表是个筐,啥都能往里装。其中的元素可以属于不同类型list.append(obj) 在列表末尾添加新的对象list.extend(seq) 在列表末尾一次性追加另一个序列中的多个值list.insert(index, obj) 在编号 index 位置插入 obj。list.remove(obj) 移除列表中某个值的第一个匹配项list.pop([index=-1]) 移除列表中的一个元素(默认最后一个元素),并且返回该元素的值

2020-07-28 22:16:27 91

原创 05. 异常处理

Python打卡第三天之异常处理异常就是运行期检测到的错误。计算机语言针对可能出现的错误定义了异常类型,某种错误引发对应的异常时,异常处理程序将被启动,从而恢复程序的正常运行。1. Python 标准异常总结BaseException:所有异常的 基类Exception:常规异常的 基类StandardError:所有的内建标准异常的基类ArithmeticError:所有数值计算异常的基类FloatingPointError:浮点计算异常OverflowError:数值运算超出最大限制

2020-07-24 22:01:34 76

原创 Python打卡第二天

Python打卡第二天大名鼎鼎的条件和循环结构条件:如果……那么,突然想起了小学语文课的造句if expression: expr_true_suiteelse: expr_false_suiteelse部分可以没有,也可以在else中再嵌套条件结构。当需要检查多个表达式是否为真时可用elif 语句代替 else ifif expression1: expr1_true_suiteelif expression2: expr2_true_suite .

2020-07-23 22:50:49 118

原创 Python打卡第一天

写在前面:deadline果然是第一生产力,训练营碰上组会+结课报告+党日活动,booooom回到正题,今天的学习内容是:变量、运算符与数据类型+位运算需要注意的点:1.算术运算符3 // 4 = 0#整除3 % 4 = 3#取余2.is, is not和==, !=a = ["hello"]b = ["hello"]print(a is b, a == b) # False Trueprint(a is not b, a != b) # True Falseis, i

2020-07-22 14:44:14 144

原创 Value Propagation Networks阅读笔记

原文及翻译Abstract摘要:We present Value Propagation (VProp), a set of parameter-efficient differentiable planning modules built on Value Iteration which can successfully be trained using reinforcement lear...

2020-04-25 17:02:37 414

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除