自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(19)
  • 收藏
  • 关注

转载 好玩儿的统计学

push:https://www.jianshu.com/p/1f0f6bd36e99beta分布:https://www.zhihu.com/question/30269898

2020-10-16 15:46:13 419

转载 Latex使用指南

latex简洁入门指南https://liam.page/2014/09/08/latex-introduction/vscode+latexhttps://zhuanlan.zhihu.com/p/120815558

2020-10-08 21:01:04 225

原创 python 输入两个整数n和m,从数列1,2,3....n中随意取几个数,使其和等于m,要求将其中所有的可能组合列出来

def main(n, m): all_path = [] path =[] def dfs(res, n): if n<=0 or res <= 0: return if res == n: path.append(n) print(path, res, n) all_path.append(list(path)) p

2020-07-25 22:25:47 2110

原创 python 搞清楚二分查找边界条件

此文看了labuladong的一篇公众号一篇文章归纳出的模板,感谢labuladong大佬带我刷题也是刷了一道题:https://leetcode-cn.com/problems/search-insert-position/才发现自己连最基础的二分查找都有些拎不清,现在来总结一下最容易错的边界条件点:right = len(nums) -1 还是 right = len(nums)?while left<=right 还是 while left < right?+1/-1?ri

2020-07-19 23:31:22 892 1

原创 DP错题总结

1. 地下城游戏思路这道题从前往后要同时保证当前房间最低血量和路径最低血量。所以倒着来,从后往前,这样只需要保证房间最低学量,因为路径最低血量不管是多少都能到达最后终点(从终点来的)动态转移方程:dp[i][j]=max(min(dp[i+1][j],dp[i][j+1])−dungeon(i,j),1)最终答案即为 dp[0][0]边界条件为,dp[n−1][m−1] 转移需要用到的 dp[n-1][m]和 dp[n][m-1]均为无效值,因此我们给这两个值赋值为 1这里 -dungeon[i

2020-07-13 23:56:31 203

转载 pytorch分布式训练

这两篇有两种方法可以直接上代码DataParallel(DP):Parameter Server模式,一张卡位reducer,实现也超级简单,一行代码。DistributedDataParallel(DDP):All-Reduce模式,本意是用来分布式训练,但是也可用于单机多卡。链接:https://fyubang.com/2019/07/23/distributed-training3/链接:https://www.cnblogs.com/yh-blog/p/12877922.html这..

2020-07-10 18:40:14 350

转载 推荐系统方面各种不错的博客

DeepFM模型CTR预估理论与实战http://fancyerii.github.io/2019/12/19/deepfm/天猫召回推荐算法MIND模型——基于动态路由的用户多兴趣网络详解https://zhuanlan.zhihu.com/p/99629077推荐系统技术演进趋势:从召回到排序再到重排写的很不错, 介绍十分全面https://zhuanlan.zhihu.com/p/100019681推荐系统—召回模型几个主要模型介绍https://zhuanlan.z..

2020-07-09 10:28:21 287

原创 python 各种层次遍历(包括n叉树)

常规层次遍历:输出整个列表比如[1,2,3,4,5]这种# Definition for a binary tree node.# class TreeNode:# def __init__(self, x):# self.val = x# self.left = None# self.right = Noneclass Solution: def levelOrder(self, root: TreeNode) -&gt.

2020-07-08 23:45:32 2784

原创 19-20paper总结

2019 SIGMOD CECI: Compact Embedding Cluster Index for Scalable Subgraph Matching划分与原图同构的子图2019 WSDM Session-Based Social Recommendation via Dynamic Graph Attention Networks将动态图网络应用到推荐上,每一个session确定为一个时刻,以用户为节点建模,用户兴趣为feature2019 WSDM Neural Tensor Fact

2020-06-24 18:53:36 435

原创 异构图前世今生

metapath2vec论文 metapath2vec: Scalable Representation Learning for Heterogeneous Networks异构图初代,主要目标是network embedding,获得节点低维映射以便进行下游任务本文提出了metapath2vec和metapath2vec++两种模型,思路:随机游走获得元路径+skipgram+logloss下图能够比较清晰地体现论文中的网络结构:缺点:效果一般,onehot输入简单粗暴,将不同类型节点映..

2020-06-18 21:02:03 2330 1

原创 图+推荐:paper总结比较

模型思路类别(是否基于传统KG算法)理论/应用以及应用场景优缺点task可能的应用方向metapath2vec随机游走+skipgram异构图理论型缺点:效果一般,onehot输入简单粗暴,将不同类型节点映射到同一向量空间显得不太合理分类item2item商品推荐EGES随机游走+skipgram+side info异构图应用;双十一产品召回同上,方法较为原始,未考虑用户特征同上商品推荐Metapath-guided Heterogeneou...

2020-06-18 20:33:31 541 1

原创 【paper总结】图神经网络+nlp(文本分类、匹配)

1.用图的分解和卷积来做文本匹配https://www.aclweb.org/anthology/P19-1632.pdf2.图表示解决长文本关系匹配问题:腾讯提出概念交互图算法论文地址:https://arxiv.org/abs/1802.07459相关数据资源:https://github.com/BangLiu/ArticlePairMatching3. alberta doctorhttps://sites.ualberta.ca/~bang3/publication.htmlhttp

2020-06-18 16:39:44 4012 1

原创 python 机器人达到指定位置方法数

牛客链接: https://www.nowcoder.com/practice/54679e44604f44d48d1bcadb1fe6eb61?tpId=101&tqId=33085&tPage=1&rp=1&ru=/ta/programmer-code-interview-guide&qru=/ta/programmer-code-interview-guide/question-ranking(在牛客里面用python容易会有时间复杂度的问题)主要思想是先写

2020-06-09 22:08:43 554

原创 python 斐波拉切数列矩阵快速幂的方法 O(logN)

常规的递归操作时间复杂度O(2^N), 循环操作时间复杂度O(N)这里介绍一种时间复杂度O(logN)的解法思路:将 F(n) = F(n-1) + F(n-2) 变换为矩阵乘法形式:[F(n),F(n-1)] = [F(1), F(0)] * [[1 1] [1 0]]^(n-1),其中**[F(1), F(0)]=[1, 0],在矩阵运算时相当于取后面矩阵运算结果第一行**例如: [F(2), F(1)] = [F(1), F(0)] * [[1 1] [1 0]] = [F(0)+F(1)

2020-06-04 12:56:11 654

原创 python算法题:2sum, 3sum, 4sum, nsum

two sum思路:一次哈希,边哈希边检测另一个数字是否已经在dict中(二次哈希也可)时间复杂度O(n) 空间复杂度O(n)PS: 其实还可以先排序再双指针(沿用3sum的思路),这样操作时间复杂度O(nlogn)空间复杂度O(1)import copyclass Solution: def twoSum(self, nums: List[int], target: int...

2020-05-05 11:12:17 515

原创 标准化和归一化

归一化(0-1 normalization/ min-max normalization)把数变为(0,1)之间的小数,特征数据范围不同归一化后方便统一处理这种方法有一个缺陷就是当有新数据加入时,可能导致max和min的变化,需要重新定义z-score 标准化(zero-mean normalization)经过处理的数据符合标准正态分布,z-score标准化方法适用于属性A的最大...

2020-04-09 12:42:28 440

转载 统计整数二进制中1的个数_不一样的各种python方法

题目分析这个题目需要注意的首先是整数,包括正整数和负整数。其次在python中,数据位数是一个比较模糊的概念,在程序中基本不存在,因为越位之后他会自动将int转为为long类型,所以对python程序员来说,需要提前搞明白整数的位数,或者在python语言中调用C语言,下面来列举其中的集中解法。技巧:python中的左移和右移与其他C/C++等的定义和结果都是不一样的,大家可以自行做实验,p...

2020-02-13 10:40:09 779

原创 ESIM模型解析-文本匹配

Enhanced LSTM for Natural Language Inference(ESIM)为文本匹配模型,在之前的短文本匹配比赛中取得了不错的效果,故现对该模型进行一些总结。该模型综合利用了biLSTM和attention机制,将一个句子各单词与另一个句子各单词特征相关性进行表示,再进行差积分析,凸显了局部推理信息,可以说这是这个模型的一大亮点。原论文中还有编码以及推理合成部分都利用Tr...

2019-12-04 18:02:05 1324

原创 dataframe常用操作

时序数据预处理Dataframe某一列去除重复项df = df['name'].drop_duplicates()创建一个空的Dateframedf = pd.DataFrame(columns=[])Dataframe根据列值选择特定行new_df= df.loc[df['name']=='some_value']Dateframe根据索引排序df = df.sort_in...

2019-03-16 18:42:20 1474

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除