Avada__Kedavra-CSDN博客

原创欢迎私信交流

如果有社招的同学想要做【推荐算法】，可以私信我哦，简历直推leader。如果想要内推其他岗位我也可以内推，但我不能跨部门直推，我可以联系认识的同事帮你直推哦。

2021-05-14 20:34:25 198

原创 Leetcode 160. 相交链表

将null也作为了一种节点，所以，当两条链表是平行的话，最终他们也都会指向null值这个虚拟节点上。：关键点是循环的条件，是 while(curA!= curB)

2023-11-14 22:44:24 193

原创 leetcode 54. 螺旋矩阵

矩阵不一定是方阵top < bottom && left < right 是循环的条件因为是按顺时针推入结果数组的，所以代码每个元素访问一次，时间复杂度 O(m*n)，m、n 分别是矩阵的行数和列数。

2023-09-12 22:39:53 220

原创 leetcode 283 移动零

通过一个快指针和慢指针在一个 for 循环下完成两个 for 循环的工作。

2023-08-28 22:03:36 114

转载协同过滤(Collaborative Filtering, CF)——经典的推荐算法

“协同过滤” 就是协同大家的反馈、评价和意见一起对海量的信息进行过滤，从中筛选出目标用户可能感兴趣的信息的推荐过程。user CF：基于用户的相似度进行推荐应用场景：具体步骤如下：下面将对“用户相似度计算”及“最终结果的排序”做详细说明。计算用户相似度，就是计算用户向量 i 和用户向量 j 之间的相似度，两个向量之间常用的相似度计算方法有如下几种：衡量了用户向量i和用户向量J之间的向量夹角大小。显然，夹角越小，证明余弦相似度越大，两个用户越相似。...

2022-06-30 11:22:12 10326 1

原创第一章互联网增长引擎——推荐系统

推荐系统存在的作用和意义可以从用户和公司两个角度进行阐述。推荐系统要处理的是“人”和“信息”的关系，即 user 与 item 间的关系。信息：推荐系统的技术架构如下图所示：推荐系统的数据部分负责数据收集与处理的三种平台按照实时性的强弱排序，依次为[2] “客户端及服务器端实时数据处理”、“流处理平台准实时数据处理”、“大数据平台离线数据处理” 。在实时性由强到弱递减的同时，三种平台的海量数据处理能力则由弱到强。一个成熟的推荐系统的数据流系统会将三者取长补短，配合使用。模型的训练方法根据模型训练环境的

2022-06-16 11:15:43 233

原创 cs 224n(3)

本讲主要简述以下几个方面：#1. 复习：word2vec的主要思路#提高训练效率的方法: 负采样在计算损失函数时，对的求和计算量是非常大的，因此需要找到更加高效的训练方法——负采样，negative sampling。............

2022-06-14 17:52:35 102

原创 embedding技术在推荐系统中的应用

embedding的主要作用是将稀疏向量转换成稠密向量。什么是embedding？embedding 是用一个低维稠密向量表示一个对象。embedding向量能够表达相应对象的某些特征，同时向量之间的距离反映了对象之间的相似性。（我推测是说embedding本身是可以表示对象特征的，）...

2022-02-22 11:43:42 920

原创 1-1 张量数据结构

程序 = 数据结构 + 算法。TensorFlow程序 = 张量数据结构 + 计算图算法语言张量：即Tensorflow的基本数据结构，张量（Tensor）即多维数组计算图：TensorFlow的所有计算都会被转化为计算图上的节点#1. 张量前面已经介绍过，张量即多维数组。标量为0维张量，向量为1维张量，矩阵为2维张量。彩色图像有rgb三个通道，可以表示为3维张量。视频还有时间维，可以表示为4维张量。可以简单地总结为：有几层中括号，就是多少维的张量。scalar = tf.constan

2021-08-24 00:17:59 184

原创《改变心理学的40项研究》第五章人的发展

#研究17 爱的发现婴儿与母亲(或者早期看护者)之间的亲密接触和依恋经历对其在今后生活中爱的能力及与他人亲近的能力有很重要的影响。行为主义者认为人的所有行为都与本能需要(如饥饿、干渴和回避痛苦等)有关。亨利·哈洛却发现，与饥饿和干渴一样，爱和情感也是一种强烈的基本内在需要，甚至比前者更强烈。用以揭示婴儿与母亲间爱的成分的方法之一，就是把婴儿放在一种特殊环境里，在这种环境中，母亲不再满足婴儿的任何需求，同时研究者可对这种环境中的多种成分进行科学的操纵##17.1 理论假设在哈洛的早期研.

2021-08-24 00:17:35 307

原创《改变心理学的40项研究》第二章知觉与意识

心理学家之所以对知觉与意识的研究非常感兴趣，是因为它们阐述并展现了人的心理与环境的相互影响。思考一下，每时每刻由周围的各种刺激组合而成的数以百万计的信息，对你的感官进行着怎样的狂轰滥炸?你的大脑不可能对所有的信息进行加工。所以，你的大脑就要把这些大量来自感官的信息资料组织成具有一定形式和意义的单元。这就是心理学家所说的“知觉”。显然，你的意识水平，通常也称为意识状态，在很大程度上控制你对什么进行知觉以及大脑怎样组织这些信息。研究5 注视偏好5.1 理论观点人类婴儿在刚出生时，可以知觉不同形态；我们可

2021-07-08 00:28:12 1489 1

原创《改变心理学的40项研究》第一章生物学与人类行为

#研究1 一个脑还是两个脑大脑的两半球并不相同，且它们的功能也不同。例如，大脑的左半球负责身体右侧的行动，反之亦然。大脑左半球控制语言能力，而大脑右半球则更多地涉及空间关系，如艺术活动所需要的相关能力。许多人相信，大脑的每侧或每个“半球”确实是可以完全分离的智力系统，它们各自具有独立的学习、记忆、认知世界甚至感受情绪的能力。这一共识的建立是多年来认真研究割裂脑的结果。这方面研究的先驱是罗杰·W·斯佩里(Roger W.Sperry，1913年 ~1994年)，他的研究在本章涉及的论文发表前15年就开

2021-07-04 12:07:25 1393

原创 word2vec(1) Huffman编码

在介绍Huffman编码前，先介绍下Huffman树。1. Huffman树树是一种重要的非线性数据结构，它是数据元素（树中称为节点）按分支关系组织起来的结构，若干棵互不相交的树所构成的集合称为森林，树中有几个重要的概念，在这里做一下简单的介绍：路径和路径长度：在一棵树中，从一个结点往下可以达到的孩子或孙子节点之间的通路，称为路径。通路中的分支的数目称为路径长度，若规定根结点的层号是1，则从根结点到第L层结点的路径长度为L-1。结点的权和带权路径长度：若为树中的结点赋予了一个具有某种含义的数

2021-06-28 11:03:21 420 1

原创 2-2 自动微分机制

神经网络通常依赖反向传播求梯度来更新网络参数，求梯度过程通常是一件非常复杂而容易出错的事情。而深度学习框架可以帮助我们自动地完成这种求梯度运算。Tensorflow一般使用梯度磁带tf.GradientTape来记录正向运算过程，然后反播磁带自动得到梯度值。这种利用tf.GradientTape求微分的方法叫做Tensorflow的自动微分机制。...............

2021-05-18 14:39:47 164

原创 Deep Learning for Matching in Search and Recommendation 搜索与推荐中的深度学习匹配（1 引言）

#1.1 搜索与推荐的概述搜索和推荐中的根本问题是从海量信息中识别满足用户信息需求的信息对象。##搜索搜索是一个用户主动输入query（一系列关键词），并用query比较明确的表达自己需求。搜索引擎通过query-doc的match匹配，返回用户最可能点击的文档。##推荐推荐一般是非主动触发的，通常不需要用户输入的query。推荐系统就是系统根据用户的属性（如性别、年龄、学历、地域、职业），用户在系统里过去的行为（例如浏览、点击、搜索、购买、收藏等），以及当前上下文环境（如网络、手机设备、时间等）

2021-05-13 11:43:44 442

原创 Deep Learning for Matching in Search and Recommendation 搜索与推荐中的深度学习匹配（0 摘要）

摘要推荐系统和搜索应该是机器学习乃至深度学习在工业界落地应用最多也最容易变现的场景。而无论是搜索还是推荐，本质其实都是匹配（match），搜索的本质是给定query，匹配doc；推荐的本质是给定user，推荐item。机器学习已广泛应用于解决此类问题，它基于输入表征和标签数据来学习匹配函数，也称为“learning to match”。近年来，人们努力开发用于匹配搜索和推荐任务的深度学习技术。得益于海量可用性数据数据、强大的计算资源和先进的深度学习技术，用于匹配的深度学习已成为最先进的搜索、推荐技术。深度

2021-05-12 21:40:29 388

原创 Deep Learning for Matching in Search and Recommendation 搜索与推荐中的深度学习匹配（目录）

最近学习了徐君、何向南、李航三位老师的《Deep learning for matching in search and Recommendation》，文章对搜索与推荐领域的深度匹配模型进行了系统、全面的介绍。

2021-05-12 18:28:53 427

原创 2-2 计算图

有三种计算图的构建方式：静态计算图，动态计算图，以及Autograph.在TensorFlow1.0时代，采用的是静态计算图，需要先使用TensorFlow的各种算子创建计算图，然后再开启一个会话Session，显式执行计算图。而在TensorFlow2.0时代，采用的是动态计算图，即每使用一个算子后，该算子会被动态加入到隐含的默认计算图中立即执行得到结果，而无需开启Session。使用动态计算图即Eager Excution的好处是方便调试程序，它会让TensorFlow代码的表现和Python原生

2021-05-10 15:53:23 263

原创 swing召回

Swing是阿里内部(目前没有论文)使用较多的基于图的召回算法。当用户u1和 u2都对物品 i 有过交互行为，（u1,u2,i）三者构成一个swing。Swing算法背后的直觉是:如果多个用户共同点击了物品i的同时，都只共同点了某一个其他的j，那么i 和 j 一定是强关联的，这种未知的强关联关系是通过用户来传递的。参考链接策略算法工程师之路-推荐召回策略推荐系统技术...

2021-04-25 16:51:30 926

原创 MIND

今天分享一篇阿里2019年发表的推荐论文《Multi-Interest Network with Dynamic Routing for Recommendation at Tmall》。#1. 摘要工业界推荐系统通常有两个阶段组成：召回（Matching）和排序(Ranking)。召回阶段我们根据用户的兴趣从海量的商品中去检索出相关候选 Item，满足推荐相关性和多样性需求。而排序阶段，依据用户兴趣会对候选集进行打分排序截取TopN Item，最终给用户产生推荐。因此，在推荐过程最重要的一环就是如何

2021-04-13 11:11:22 110

原创回调函数同步回调异步回调（草稿）

回调函数同步回调异步回调参考链接1.回调函数（callback）是什么？

2021-03-05 15:12:20 117

原创近似最近邻（Approximate Nearest Neighbor, ANN）检索

参考链接干货 | 一文读懂 ANN一文尽览近似最近邻搜索中的哈希与量化方法最近邻检索（NN）和近似最近邻（ANN）检索Facebook深度学习应用 | 最近邻搜索算法速度数百倍之差，有人断言KNN面临淘汰，更快更强的ANN将取而代之...

2021-03-03 18:37:42 4088 1

原创谷歌命令行解析工具gflags详解（草稿）

参考链接谷歌命令行解析工具gflags详解

2021-02-25 11:05:55 134

原创 2-1 张量数据结构

程序 = 数据结构+算法。TensorFlow程序 = 张量数据结构 + 计算图算法语言张量和计算图是 TensorFlow的核心概念。Tensorflow的基本数据结构是张量Tensor。张量即多维数组。Tensorflow的张量和numpy中的array很类似。从行为特性来看，有两种类型的张量，常量constant和变量Variable。常量的值在计算图中不可以被重新赋值，变量可以在计算图中用assign等算子重新赋值。.........

2021-02-20 14:35:48 253

转载二、TensorFlow的核心概念

TensorFlow™ 是一个采用数据流图（data flow graphs），用于数值计算的开源软件库。节点（Nodes）在图中表示数学操作，图中的线（edges）则表示在节点间相互联系的多维数据数组，即张量（tensor）。它灵活的架构让你可以在多种平台上展开计算，例如台式计算机中的一个或多个CPU（或GPU），服务器，移动设备等等。TensorFlow 最初由Google大脑小组（隶属于Google机器智能研究机构）的研究员和工程师们开发出来，用于机器学习和深度神经网络方面的研究，但这个系统的通用性

2021-01-15 20:16:10 176

原创 1-4 时间序列数据建模流程范例

本篇文章将利用TensorFlow2.0建立时间序列RNN模型，对国内的新冠肺炎疫情结束时间进行预测。

2021-01-15 18:33:22 277

原创 1-3 文本数据建模流程范例

#一、准备数据imdb数据集的目标是根据电影评论的文本内容预测评论的情感标签。训练集有20000条电影评论文本，测试集有5000条电影评论文本，其中正面评论和负面评论都各占一半。文本数据预处理较为繁琐，包括中文切词（本示例不涉及），构建词典，编码转换，序列填充，构建数据管道等等。在tensorflow中完成文本数据预处理的常用方案有两种，第一种是利用tf.keras.preprocessing中的Tokenizer词典构建工具和tf.keras.utils.Sequence构建文本数据生成器管道。

2021-01-15 18:32:09 257

Hands-On Machine Learning with Scikit-Learn and TensorFlow高清书籍+代码.zip

空空如也