十年前的海苔
码龄4年
关注
提问 私信
  • 博客:59,785
    59,785
    总访问量
  • 28
    原创
  • 57,033
    排名
  • 22
    粉丝
  • 0
    铁粉
  • 学习成就
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:辽宁省
  • 加入CSDN时间: 2020-11-20
博客简介:

Edward_Legend的博客

查看详细资料
  • 原力等级
    成就
    当前等级
    3
    当前总分
    267
    当月
    11
个人成就
  • 获得75次点赞
  • 内容获得4次评论
  • 获得354次收藏
创作历程
  • 1篇
    2024年
  • 27篇
    2021年
成就勋章
TA的专栏
  • 机器学习算法
    7篇
  • 推荐系统
    9篇
  • python数据结构
    7篇
兴趣领域 设置
  • 编程语言
    java
创作活动更多

如何做好一份技术文档?

无论你是技术大神还是初涉此领域的新手,都欢迎分享你的宝贵经验、独到见解与创新方法,为技术传播之路点亮明灯!

180人参与 去创作
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

使用nvm管理node多版本

安装完成后可以分别输入命令行 node -v 和 npm -v,检验node.js以及对应npm是否安装成功。
原创
发布博客 2024.10.29 ·
111 阅读 ·
3 点赞 ·
0 评论 ·
0 收藏

GAT图注意力网络

GAT(Graph Attention Networks),加入了注意力机制的图神经网络,与GCN不同的是,其消息传递的权重是通过注意力机制得到。GAT的计算过程:aij=softmaxjeijexp(eij)Σk∈Niexp(eik)a_{ij}=softmax_{j}e_{ij}\frac{exp(e_{ij})}{\Sigma_{k∈N_i}exp(e_{ik})}aij​=softmaxj​eij​Σk∈Ni​​exp(eik​)exp(eij​)​     (1)eij=LeakyReLU(
原创
发布博客 2021.11.30 ·
3732 阅读 ·
2 点赞 ·
0 评论 ·
16 收藏

注意力机制与兴趣演化在推荐系统当中的应用

什么是“注意力机制”**“注意力机制”来源于人类天生的“选择性注意”的习惯。**最典型的例子是用户在浏览网页时,会有选择性地注意页面的特定区域,而忽视其他区域。比如下图是 Google 对大量用户进行眼球追踪实验后,得出的页面注意力热度图。我们可以看到,用户对页面不同区域的注意力区别非常大,他们的大部分注意力就集中在左上角的几条搜索结果上。   “注意力机制”对我们构建推荐模型来说价值是非常大的。比如说我们要做一个新闻推荐的模型,让这个模型根据用户已经看过的新闻做推荐。那我们在分析用户已浏览新闻的时候
原创
发布博客 2021.11.30 ·
1056 阅读 ·
1 点赞 ·
0 评论 ·
2 收藏

特征工程:推荐系统中的特征

什么是特征工程推荐系统就是利用“用户信息”“物品信息”“场景信息”这三大部分有价值数据,通过构建推荐模型得出推荐列表的工程系统。  在这个系统之中,特征工程就是利用工程手段从“用户信息”“物品信息”“场景信息”中提取特征的过程。这个过程说起来容易,但实际做起来其实困难重重。比如说,一个网站或者 App 每天收集起来的用户日志,采集来的站外信息,自己公司员工编辑添加的结构化数据那么多,那么庞杂,怎么才能挑出那些对推荐有用的特征呢?再比如从“推荐模型”的角度来说,一个机器学习模型的输入,往往是一个数值型的
原创
发布博客 2021.11.29 ·
1533 阅读 ·
0 点赞 ·
0 评论 ·
7 收藏

GCN图卷积网络

GCN图卷积网络GCN全称graph convolutional networks.图卷积网络,提出于2017年。GCN的出现标志着图神经网络的出现。深度学习最常用的网络结构就是CNN,RNN,GCN与CNN不仅名字相似,其实理解起来也很类似,都是特征提取器。不同的是,CNN提取的是张量数据特征,而GCN提出的是图结构数据特征。1.计算过程初期研究者为了从数学上严谨的推导GCN公式是有效的,所以会涉及到诸如傅里叶变换,拉普拉斯算子的知识。其实对于我们使用者而言,我们可以绕开那些知识并且毫无影响的理解G
原创
发布博客 2021.11.29 ·
3632 阅读 ·
4 点赞 ·
1 评论 ·
19 收藏

图神经网络在推荐系统中的应用

  互联网中到处都是图结构的数据,比如我们熟悉的社交网络,最近流行的知识图谱等等,这些数据中包含着大量的关系信息,这对推荐系统来说是非常有帮助的。  为了能更好地利用这些信息进行推荐,各大巨头可谓尝试了各种办法,比如 DeepWalk、Node2Vec 这些非常实用的 Graph Embedding 方法。但是技术的发展永无止境,最近两年,GNN(Graph Nerual Netwrok,图神经网络)毫无疑问是最火热、最流行的基于图结构数据的建模方法。严格一点来说,图神经网络指的就是可以直接处理图结构数据
原创
发布博客 2021.11.22 ·
2325 阅读 ·
2 点赞 ·
0 评论 ·
26 收藏

Embedding+MLP

  MLP是 Multilayer perceptron,多层感知机的缩写。感知机是神经元的另外一种叫法,所以多层感知机就是多层神经网络。下面以微软著名的深度学习模型 Deep Crossing 为例来说明 Embedding+MLP 模型的结构和实现方法。  图 1 展示的就是微软在 2016 年提出的深度学习模型 Deep Crossing,微软把它用于广告推荐这个业务场景上。它是一个经典的 Embedding+MLP 模型结构,我们可以看到,Deep Crossing 从下到上可以分为 5 层,分别
原创
发布博客 2021.11.22 ·
1486 阅读 ·
0 点赞 ·
0 评论 ·
8 收藏

协同过滤与矩阵分解

协同过滤算法的基本原理用户行为数据是推荐系统最常用,也是最关键的数据。用户的潜在兴趣、用户对物品的评价好坏都反映在用户的行为历史中。而协同过滤算法,就是一种完全依赖用户和物品之间行为关系的推荐算法。我们从它的名字“协同过滤”中,也可以窥探到它背后的原理,就是 “协同大家的反馈、评价和意见一起对海量的信息进行过滤,从中筛选出用户可能感兴趣的信息”一起看一个电商场景下的例子。这个电商推荐系统从得到原始数据到生成最终推荐分数,全过程一共可以总结为 6 个步骤,如下所示。首先,我们可以看到,电商网站的商品库
原创
发布博客 2021.11.22 ·
4916 阅读 ·
7 点赞 ·
0 评论 ·
35 收藏

利用图结构数据生成Graph Embedding

我们知道,只要是能够被序列数据表示的物品,都可以通过 Item2vec 方法训练出 Embedding。但是,互联网的数据可不仅仅是序列数据那么简单,越来越多的数据被我们以图的形式展现出来。这个时候,基于序列数据的 Embedding 方法就显得“不够用”了。但在推荐系统中放弃图结构数据是非常可惜的,因为图数据中包含了大量非常有价值的结构信息。下面就重点来讲基于图结构的 Embedding 方法,它也被称为 Graph Embedding。互联网中的图结构数据事实上,图结构数据在互联网中几乎无处不
原创
发布博客 2021.11.22 ·
981 阅读 ·
1 点赞 ·
0 评论 ·
4 收藏

Embedding 基础

一、什么是Embedding简单来说,Embedding 就是用一个数值向量“表示”一个对象(Object)的方法,这里说的对象可以是一个词、一个物品,也可以是一部电影等等。一个物品能被向量表示,是因为这个向量跟其他物品向量之间的距离反映了这些物品的相似性。更进一步来说,两个向量间的距离向量甚至能够反映它们之间的关系。这个解释听上去可能还是有点抽象,那我们再用两个具体的例子解释一下。上图是 Google 著名的论文 Word2vec 中的例子,它利用 Word2vec 这个模型把单词映射到了高维空间中
原创
发布博客 2021.11.21 ·
22122 阅读 ·
41 点赞 ·
3 评论 ·
178 收藏

02链路预测

什么是链路预测链路预测是一个利用图网络做预测的经典任务。所谓链路(Link)指节点与节点之间的连接,也就是图论中的边。如上图所示,所谓链路预测就是预测原本不相连的两个节点之间是否有边存在,若是在有权图中,那就顺便还预测下相邻边的权重。如果该图是一个社交网络图,那么链路预测的任务就好比是在预测某个用户是否对另一个用户感兴趣,也就是好友推荐任务,如果是一个用户物品图,那么链路预测就是物品推荐任务。链路预测本身是一门学科,已经有好几十年历史了,推荐是它最主要的应用方向。如今来链路预测总是不温不火。究其原
原创
发布博客 2021.11.19 ·
5705 阅读 ·
11 点赞 ·
0 评论 ·
38 收藏

01图论基础

什么是图图的基本示意图图是描述复杂事务的数据表示形式,由节点和边组成,数学上一般表述为图G-(V,E)。其中的V(vertical)代表节点,可被理解为事物。而E(edge)代表边,描述的是两个事物之间的关系。例如一个图的社交网络图,每个人都可视为节点,而人与人之间的关系可被视为边。而在我们的推荐系统中,用户与物品之间的交互关系,用户与用户自身的关系,物品与物品之间的关系,完全可由一张图完整的进行描述。如下图所示:用户与物品之间的关系图无向图与有向图无向图有向图双向图无向图是由没有方
原创
发布博客 2021.11.17 ·
1791 阅读 ·
0 点赞 ·
0 评论 ·
5 收藏

机器学习07:决策树基本流程

什么是决策树
原创
发布博客 2021.11.13 ·
2990 阅读 ·
1 点赞 ·
0 评论 ·
5 收藏

机器学习06:朴素贝叶斯算法

朴素贝叶斯的思想如下:假设我们有四篇文章,三个类别,要判断每一篇文章属于哪一种类别,这种算法是将文章属于每一种概率的类别计算出来,并且判断它属于哪一种类别的概率最大,那么它就属于这个类别先介绍一下与概率有关的内容概率定义为一件事情发生的可能性联合概率:包含多个条件,且所有条件同时成立的概率记作:P(A,B)P(A,B) = P(A)P(B)上表中职业是程序员并且体型匀称的概率是多少?P(程序员, 匀称) = (3/7)*(4/7) = 12/49条件概率:事件A在事件B已经发生条件下的
原创
发布博客 2021.11.13 ·
834 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

机器学习05:转换器与估计器

一、转换器回想一下之前做的特征工程的步骤1、实例化(实例化的是一个转换器类(Transformer)2、调用fit-transform(对于文档建立分类词频矩阵,不能同时调用)fit_transform()就是先fit(输入数据),再transform(转换数据)举个例子:from sklearn.preprocessing import StandardScalers = StandardScaler()data = s.fit_transform([[1, 2, 3], [4, 5,
原创
发布博客 2021.11.12 ·
741 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

机器学习04:机器学习算法分类及开发流程简介

一、算法分类在介绍机器学习算法之前,先来明确两个概念:离散型数据和连续性数据离散型数据:上图是一组离散型数据,它是由记录不同类别个体的数目所得到的数据,又称计数数据,例如人口数、班级数量、特定范围内的汽车数量……所有这些数据全部都是整数,而且不能再细分,也不能进一步提高他们的精确度.连续性数据:变量可以在某个范围内取任一数,即变量的取值可以是连续的,如,长度、时间、质量值等,这类整数通常是非整数,含有小数部分。明确了上述概念,我们来看机器算法的分类:大致可以分为两种:监督学习和无监督学习
原创
发布博客 2021.11.12 ·
953 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

机器学习03:特征选择

一、特征选择是什么特征选择就是单纯地从提取到的所有特征中选择部分特征作为训练集特征,特征在选择前和选择后可以改变值、也不改变值,但是选择后的特征维数肯定比选择前小,毕竟我们只选择了其中的一部分特征。主要方法(三大武器):Filter(过滤式):VarianceThresholdEmbedded(嵌入式):正则化、决策树Wrapper(包裹式)这里我们我们主要过滤式,其余的后续再介绍二、特征降维的实现1.Filter(过滤式):VarianceThresholdVarianceThresho
原创
发布博客 2021.11.12 ·
1336 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

机器学习02:特征预处理

什么是特征预处理通过特定的统计方法(数学方法)将数据转换成算法要求的数据数值型数据:标准缩放:1、归一化2、标准化3、缺失值类别型数据:one-hot编码时间类型:时间的切分归一化特点:通过对原始数据进行变换把数据映射到(默认为[0,1])之间公式:注:作用于每一列,max为一列的最大值,min为一列的最小值,那么x"为最终结果,mx,mi分别为指定区间值默认mx为1,mi为0那么为什么需要将数据归一化呢?来看一个例子这是一组约会对象的数据这个样本是男士的数据,包含三个特征
原创
发布博客 2021.11.11 ·
365 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

机器学习01:入门案例-文本特征抽取

一、字典特征抽取字典数据抽取就是把字典中的一些类别数据分别转化成特征值from sklearn.feature_extraction import DictVectorizerdef dictvec(): """ 字典数据提取 """ # 实例化 dict = DictVectorizer(sparse=False) # sparse=False后,dict在调用fit_transform后则返回的是ndarray # 调用fit_tra
原创
发布博客 2021.11.10 ·
1253 阅读 ·
0 点赞 ·
0 评论 ·
4 收藏

python数据结构:07 排序算法(1)

冒泡排序def bubble_sort(alist): """ 冒泡排序 最坏时间复杂度:O(n2) 稳定性:稳定 """ n = len(alist) for i in range(0, n-1): for j in range(0, n-1-i): if alist[j] > alist[j+1]: alist[j], alist[j+1] = alist[j+1],
原创
发布博客 2021.11.04 ·
375 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏
加载更多