EmoryHuang-CSDN博客

原创【论文阅读】GETNext: Trajectory Flow Map Enhanced Transformer for Next POI Recommendation

Next POI 推荐是根据用户的当前状态和历史信息，预测用户近期的动向，为用户和服务提供商带来巨大的价值。2022 年 SIGIR 的一篇论文：GETNext: Trajectory Flow Map Enhanced Transformer for Next POI Recommendation

2022-07-23 11:32:34 2453 1

原创 Time2Vec 的理解与简单实现

Time2Vec 从其名字就可以看出其功能，将时间进行 Embedding，并且能够应用于不同的模型。

2022-07-23 11:31:37 3998 1

原创聊一聊损失函数

损失函数，具体来说就是计算神经网络每次迭代的前向计算结果与真实值的差距，从而指导下一步的训练向正确的方向进行。下面主要介绍一些常见的损失函数：均方差损失函数和交叉熵损失函数。...

2022-07-20 16:33:12 1028

原创【论文阅读】Geography-Aware Sequential Location Recommendation

顺序位置推荐在许多应用中发挥着重要作用，如移动性预测、路线规划和基于位置的广告。它不但可以提高用户体验，增加用户粘性，还能为商家带来潜在的商业利益，已成为推荐系统中最重要的研究方向之一。...

2022-07-14 10:24:10 592

原创简单理解图神经网络 GNN

图神经网络（Graph Neural Networks，GNN）最早由The Graph Neural Network Model(Gori et al., 2005)提出。近年来，深度学习领域关于图神经网络的研究热情日益高涨，图神经网络已经成为各大深度学习顶会的研究热点。......

2022-07-02 19:07:40 1070

原创【论文阅读】DynaPosGNN: Dynamic-Positional GNN for Next POI Recommendation

随着基于位置的社交网络（Location-Based Social Network）的快速发展，海量的签到数据被用于挖掘用户的行为模式以实现兴趣点（Point-of-Interest）推荐。兴趣点推荐不但可以提高用户体验，增加用户粘性，还能为商家带来潜在的商业利益，已成为推荐系统中最重要的研究方向之一。......

2022-07-01 21:21:44 509

原创【论文阅读】ALBERT: A LITE BERT FOR SELF-SUPERVISED LEARNING OF LANGUAGE REPRESENTATIONS

在 BERT 提出之后，各种大体量的预训练模型层出不穷，在他们效果不断优化的同时，带来的是巨大的参数量和漫长的训练时间。当然对于这个问题，也有大量的研究。ALBERT是谷歌在 BERT 基础上设计的一个精简模型，主要为了解决 BERT 参数过大、训练过慢的问题。...

2022-07-01 21:21:03 504

原创【论文阅读】Attention Is All You Need

Transformer 是谷歌在 2017 年底发表的论文 Attention Is All You Need 中所提出的 seq2seq 模型，Transformer 的提出也给 NLP 领域带来了极大震动。现如今，不少模型还是以 Transformer 作为特征抽取机制，比如 BERT 就是从 Transformer 中衍生出来的预训练语言模型。Transformer 完全抛弃了传统的 CNN 和 RNN，整个网络结构完全是由 Attention 机制组成。...

2022-07-01 21:20:15 734 1

原创【论文阅读】BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding

BERT 是 Google 于 2018 年提出的 NLP 预训练技术，全称是 **B**idirectional **E**ncoder **R**epresentations from **T**ransformers，直译可以理解为双向 Transformer 的 Enocder。

2022-06-13 19:35:02 657

原创简单使用 Frp

frp 是一个专注于内网穿透的高性能的反向代理应用，支持 TCP、UDP、HTTP、HTTPS 等多种协议。可以将内网服务以安全、便捷的方式通过具有公网 IP 节点的中转暴露到公网。

2022-06-10 20:16:32 728

原创摩尔投票法学习笔记

博耶-摩尔多数投票算法（英语：Boyer–Moore majority vote algorithm）,中文常作多数投票算法、摩尔投票算法等，是一种用来寻找一组元素中占多数元素的常数空间级时间复杂度算法。这一算法由罗伯特·S·博耶和 J·斯特罗瑟·摩尔在 1981 年发表，也是处理数据流的一种典型算法。...

2022-06-10 20:15:08 849

原创二分查找学习笔记

二分查找也称折半查找，它是一种效率较高的查找方法，思路很简单，细节是魔鬼。本文主要探究几个最常用的二分查找场景：寻找一个数、寻找左侧、右侧边界，并给出二分模板。

2022-06-10 20:13:41 224

原创 Spark 与 DataFrame

在 Spark 中，除了 RDD 这种数据容器外，还有一种更容易操作的一个分布式数据容器 DateFrame，它更像传统关系型数据库的二维表，除了包括数据自身以外还包括数据的结构信息（Schema），这就可以利用类似 SQL 的语言来进行数据访问。...

2022-06-10 20:09:43 638

原创字符串之字符串哈希

Hash 函数有助于解决很多问题，如果我们想有效地解决比较字符串的问题，最朴素的办法是直接比较两个字符串，这样做的时间复杂度是$O(\min(n_1,n_2))$，字符串哈希的想法在于，我们将每个字符串转换为一个整数，然后比较它们而不是字符串。......

2022-06-10 20:07:53 795

原创从 Embedding 到 Word2Vec

`Word Embedding` 是将自然语言中的「单词」转换为「向量」或「矩阵」，使计算机更容易理解它们，你常常可以在自然语言处理的工作中见到这种方法。而 `Word2Vec` 正是 `Word Embedding` 的一种。

2022-06-10 20:05:28 534

原创使用 Caddy 替代 Nginx

Caddy是一个 `Go` 编写的 `Web` 服务器，类似于 `Nginx`。相较于 `Nginx` 来说，`Caddy` 的配置简单了很多，而且默认启用了 `https`，更加的安全。

2022-06-08 20:49:31 2444

原创线段树模板

线段树是算法竞赛中常用的用来维护 **区间信息** 的数据结构。线段树可以在$O(\log{N})$的时间复杂度内实现单点修改、区间修改、区间查询（区间求和，求区间最大值，求区间最小值）等操作。...

2022-06-08 20:48:51 196

原创 Redis 时间序列

REmote DIctionary Server(Redis) 是一个使用 ANSI C 编写的开源、支持网络、基于内存、分布式、可选持久性的键值对存储数据库。

2022-06-08 20:47:59 1155

原创【论文阅读】Time-Series Anomaly Detection Service at Microsoft

「异常检测」旨在发现数据中的意外事件或罕见项目。它在许多工业应用中非常流行，是数据挖掘中的一个重要研究领域。

2022-06-08 20:46:16 1037

原创【论文阅读】Modeling Extreme Events in Time Series Prediction

论文原文时间序列预测是数据挖掘中一个深入研究的课题。尽管取得了相当大的进步，但最近基于深度学习的方法忽略了极端事件的存在，这导致将它们应用于实时序列时性能较弱。

2022-06-08 20:45:47 569

原创树状数组学习笔记

树状数组或二叉索引树(Binary Indexed Tree)，又以其发明者命名为 Fenwick 树

2022-06-08 20:45:01 171

原创 Linux 文件权限

`Linux` 系统是一种典型的多用户系统，不同的用户处于不同的地位，拥有不同的权限。

2022-06-08 20:43:25 1102

原创 Neo4j 之 Cypher 笔记

Cypher 是 Neo4j 提出的图查询语言，是一种声明式的图数据库查询语言，如同关系数据库中的 SQL，它拥有精简的语法和强大的表现力，能够精准且高效地对图数据进行查询和更新。

2022-06-08 20:41:11 381

原创 Self Attention 详解

注意力机制（Attention），之前也是一直有所听闻的，也能够大概理解 Attention 的本质就是加权，对于 Google 的论文《Attention is all you need》也只是一直听闻，现在乘着机会也是好好读一读。

2022-06-08 20:40:26 7657 2

原创浅析 K-L 变换

K-L 变换浅析

2022-06-08 20:39:36 1129

原创 AutoEncoder 学习笔记

AutoEncoder 学习笔记前言AutoEncoder 作为神经网络里的一类模型，采用无监督学习的方式对高维数据进行特征提取和特征表示，其目的是重构输入（最小化输入和输出之间的差异），而不是在给定输入的情况下预测目标值。AutoEncoder 简介上面这张图很好的描述了 AutoEncoder 的工作原理，首先是一个数据输入，它可以是图片或是一串序列，就像上图描述的一样，一幅图片经过一个 Encoder 网络之后，得到了 Compressed representation ，也就是我们所谓的这

2021-12-16 15:31:14 866 1

原创时间序列数据建模流程范例

时间序列数据建模流程范例前言最开始在学习神经网络，PyTorch 的时候，懂的都还不多，虽然也知道 RNN, CNN 这些网络的原理，但真正自己实现起来又是另一回事，代码往往也都是从网上 copy 过来然后再自己魔改的，这也就导致了一系列的问题，代码格式不统一，没弄懂具体实现细节等等。当然，凭这些 copy 过来的代码让模型运行起来还是不难的，你只需要知晓一定的原理。显而易见，这些时间往往最后都是要“还”的。写这篇文章主要还是记录一下整体的思路，并对网络训练的整个过程进行标准化。当然，这只是我自己在写

2021-12-16 15:30:36 2123

空空如也

空空如也