自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 阿里 DIN (Deep Interest Network for Click-Through Rate Prediction) 论文笔记

为了使其足够强大,一个简单的方法是扩大嵌入向量的维数,不幸的是,这将大大增加学习参数的大小。固定长度向量的使用是一个瓶颈,这给embedding和mlp方法从丰富的历史行为中有效捕获用户的不同兴趣带来了困难。的非零值的数量在不同的实例中是不同的,导致相应的嵌入向量列表的长度是可变的。由于全连接网络只能处理固定长度的输入,通常的做法是通过池化层对嵌入向量列表进行变换,得到固定长度的向量。的值在某种程度上被视为用户兴趣强度激活的近似值,同一个用户,有相同行为序列情况下,对于感兴趣的广告,其。

2024-03-18 17:04:27 1489

原创 MapReduce阶段都在干什么?

在 Map 阶段,每个 Mapper 读取其分配到的文件内容,然后为文本中每个出现的单词输出(单词,1) 的键值对。在 Shuffle 阶段,所有 Mapper 的输出会被收集起来,并且根据中间键进行排序和分组,以便分配给 Reduce 阶段。在 Reduce 阶段,MapReduce 程序中的 Reducer 接受 Shuffle 阶段的输出,并对每一组具有相同中间键的键值对进行汇总,输出最终的结果。继续我们的统计单词出现次数的例子,Reducer 会将每个单词的出现次数相加,得到最终计数。

2024-02-05 10:20:22 417 1

原创 RobustScaler的计算方法/原理 (举例解释)

四分位距通常是用来构建箱形图,以及对概率分布的简要图表概述。对一个对称性分布数据(其中位数必然等于第三四分位数与第一四分位数的算术平均数),二分之一的四分差等于绝对中位差(MAD)。但是scale(The (scaled) interquartile range for each feature in the training set.) 为什么是 [3,1.5,2.5]呢。其实是因为官网例子给的training set 长度为3,因此没法直接算四分位距。每列的特征中位值不难理解 [1,1,2]

2023-02-08 17:42:34 2067 2

原创 旅行商问题(Travelling salesman problem, TSP)

旅行商问题(Travelling salesman problem, TSP)是组合优化中的一个NP困难问题,在运筹学和理论计算机科学中非常重要。问题内容为“给定一系列城市和每对城市之间的距离,求解访问每一座城市一次并回到起始城市的最短回路。”本帖只讨论问题的建模,并对公式作进一步的说明补充。该问题目前的求解方案包括精确精算法(分支定界,动态规划,benders分解等)、启发式解法、强化学习等。

2022-11-08 18:08:58 1016

原创 推荐算法-多目标学习总结

mutil-task learning,本质上是用一个模型完成多个任务的建模、在推荐系统中,多任务学习一般即指多目标学习(multi-label learning),不同目标输入相同的feature进行联合训练,是迁移学习的一种。他们之间的关系如图:q1:为什么要用多目标学习?1、很多业界推荐业务,天然就是多目标建模场景,需要多目标共同优化。2、工程便利。一般推荐系统中排序模块延时需求在40ms左右,如果分别对每个任务单独训练一个模型,难以满足需求。q2:为什么多任务学习有效?

2022-09-14 21:00:52 1532

原创 企业级开发学习路线

企业级开发学习路线1 语言:C ,C++, Java,Python2 基础四大件:数据结构和算法:字符串、链表、二叉树、堆栈、队列、哈希表。​ 查找、排序、动态规划推荐书籍:《大话数据结构》、《算法》、《剑指offer》计算机网络:TCP、IP协议栈:ARP协议、IP协议、ICMP协议、TCP协议、UDP协议、DNS协议、HTTP协议和HTTPS协议​ 推荐书籍:《TCP/IP详解》操作系统:进程和线程、并发和多线程。内存分布和内存调度的算法​ 推荐

2022-02-16 21:59:37 679

原创 简单明了的介绍了python面向对象编程

Python面向对象编程在本文中,您将学习Python中的OOP的以下基本概念:Python类对象实例定义和使用方法OOP继承什么是面向对象编程(OOP)?面向对象编程(Object-oriented Programming,简称OOP)是一种编程范例,它提供了一种结构化程序的方法,以便将属性和行为捆绑到单个对象中。例如,对象可以表示具有姓名属性,年龄,地址等的人,具有行走,说话,呼吸和跑步等行为。或者包含收件人列表,主题,正文等属性的电子邮件,以及添加附件和发送等行为。换句话说,面向

2022-02-11 17:48:39 246 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除