自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(57)
  • 资源 (1)
  • 收藏
  • 关注

原创 几种GNN模型的应用与改进

近期又陆续看了一些关于GNN的文章,这些文章总体上都是想要解决一个问题,就是如何从大规模图数据中,能有效嵌入节点和拓扑结构的信息,同时降低计算的复杂度,缓解过拟合的风险。有效地对图结构数据的节点进行embedding就需要考虑数据本身的特征,同时也要考虑不同应用场景以及下游任务的目标。在实际场景中,图数据本身就是错综复杂的,节点直接的联系有些是我们可以从先验知识中得到的,有些是无法直接定义,或者需要从模型中隐式地学习。关于图的描述和学习就有很多方法,比如从邻近的定义有deepwalk、Node2Vec、m

2020-11-20 15:31:56 3252

原创 深入浅出了解GNN的几种变体

接上篇博客,这周主要学习了GraphSAGE,GAT,R-GCN 三种GNN的变体模型,从空域的角度出发,对节点的嵌入表征进行了深入的研究。**(本文作为笔者的学习笔记,如有错误,希望各位读者批评指正)**

2020-11-08 11:31:41 3082 4

原创 深入浅出了解GCN原理(公式+代码)

相信大多数读者在了解GCN(Graph Convolutional Networks)之前,对CNN(Convolutional Neural Network)都是非常熟悉的,我们知道,在连续信号中的卷积是表征函数f与g经过翻转和平移的重叠部分函数值乘积对重叠长度的积分,如下公式(1)。∫−∞+∞f(τ)g(x−τ)dτ(1)\int_{-\infty}^{+\infty} f(\tau)g(x-\tau)d\tau \qquad\qquad\qquad (1)∫−∞+∞​f(τ)g(x−τ)dτ(

2020-11-01 21:27:11 19169 15

原创 PAKDD2020 阿里巴巴智能运维算法大赛 总结(初赛33,决赛19)

赛题地址:PAKDD2020 阿里巴巴智能运维算法大赛-大规模硬盘故障预测Githun代码地址:初赛+复赛问题描述给定一段连续采集(天粒度)的硬盘状态监控数据(Self-Monitoring, Analysis, and Reporting Technology; often written as SMART)以及故障标签数据,参赛者需要自己提出方案,按天粒度判断每块硬盘是否会在未来30日内...

2020-04-29 13:00:03 3775 11

原创 机器学习-EM算法通俗详解

本篇参考了白板推导系列以及其他关于EM算法的书籍,尽力做到通俗易懂,我第一次学习的时候也是各种混乱,尤其是在学习完理论之后,具体实践和代码实现都还是很模糊。在查阅了多方资料,和各种大神的博客之后,终于算是弄懂了,在此集百家之长,站在巨人的肩膀上,总结和推导下EM的从始到终,如果不足之处还望多多指正。一、为什么使用EM算法(什么情况下使用)在学习一个知识的时候,我认为最关键的是要知道我们为什么学...

2020-03-15 13:07:18 518

原创 Hyper-V的Ubutun虚拟机使用宿主机显卡GPU

Hyper-v

2024-03-16 16:05:14 1311 3

原创 Vim操作的常用命令记录

主要用于记录,好查阅熟悉(过于简单常用的也不记录了)行尾(类似正则表达式语法)向下查找关键字word。:调整当前窗口的大小。

2023-10-01 16:48:52 473

原创 Deep Network with Stochastic Depth(阅读笔记)一种随机深度的正则化方法

最近Swin Transformer在计算机视觉上大放异彩,成为许多视觉榜单上的霸主,然而传统的Conv卷积如Resnet就真的不行了吗? 一些学者就传统的卷积网络进行了深入的研究,并通过细致的实验,精心设计的结构和一些"trick",实验表明,Convnet的能力并不亚于Transformer。最近笔者就 Revisiting ResNets:Improved Training and Scaling Strategies 这篇文章中提到的一些trick进行了相关调研。本篇笔记主要调研的是论文中.

2022-01-20 22:12:14 4511 2

原创 SynFace Face: Recognition with Synthetic Data 阅读笔记

SynFace: Face Recognition with Synthetic Data该文主要目的是将合成的人脸数据用于人脸识别模型的训练,指出了用生成图像来训练无法达到真实图片效果的原因,并给出了解决方法。文中同时还讨论了数据集的深度和广度对模型性能的影响,并研究了数据中一些属性如光照、表情、姿势等对训练结果的影响。背景近年来,人脸识别在一系列具有挑战性的问题上取得了非凡的进展,比如不同年龄匹配、多模态模态,遮挡人脸等问题。在这些发展中,不单单是对网络模型的改进或是对损失的改进,数据集的规模和

2021-10-18 22:35:47 1806 2

原创 万字长文:人脸识别综述(学习笔记)

人脸的检查与识别是一个历史悠久的方向,之前没做过相关的工作,所以对人脸检测的相关流程没有很清晰的概念。工作原因,近期对人脸识别的来龙去脉做一个笔记和知识梳理,从上到下做个pipeline,部分资料是直接引用或摘抄,如有侵犯版权,还望及时与笔者联系进行删除或整改。一、人脸识别背景人脸识别可以分为以下三种场景模式,分别为1:1.1:N,N:N.1:1 问题银行柜台、海关、手机解锁、酒店入住、网吧认证,会查身份证跟你是不是同一个人。这个应用的主要特点是,在大多数场景下都需要你先提供一个证件,然后跟自.

2021-10-07 21:35:11 2896 4

原创 2021微信大数据挑战赛总结(微信视频号推荐)

赛程持续大概了两个多月的时间,从笔者临近毕业到工作,算是学生时代最后一个比赛吧,遗憾的是成绩并不是很理想,最后只拿到了国二,到了复赛阶段又是被迫solo的局面。复赛期间体会到了在职人员的不易,白天上班,晚上熬夜打比赛,真的太难了┭┮﹏┭┮。最后,做为学生时代的“收官之赛”,还是在此记录下比赛过程中学习到的知识,感谢周周星的分享以及大佬们无私的开源,努力向前排优秀选手学习。一、赛题描述此次比赛基于脱敏和采样后的数据信息,对于给定的一定数量到访过微信视频号“热门推荐”的用户, 根据这些用户在视频号内的历.

2021-08-16 23:28:44 2598 12

原创 天池比赛如何使用docker提交

天池上的比赛,一般复赛阶段会让参赛选手使用docker封装好容器后,提交到线上得到结果,推理或者训练过程放在赛方提供的硬件环境下,选手一般是接触不到测试集的,更加保证了比赛的公平性。 笔者接触docker和使用已经有几次了经历了,但是都只是用于比赛,所以平时并不常使用,导致每次用的时候都要在查查资料回顾下,现在记录一下主要的提交步骤,以遍日后复习使用。一、机制天池平台提供了基于GPU计算资源的提交镜像的方式,将本地代码打包成镜像提交,推送至阿里云容器镜像仓库后,在天池提交页面中输入镜像地址、用户名.

2021-04-15 23:02:04 1524 2

原创 基于消息传递框架的图卷积网络( Pytorch Geometric版)

数据格式参考:图数据通常成对的包含两部分信息,即以边(edge)的形式表示的关系(relation) 和 以节点(node)的形式表示的对象,在pytorch_geometric中,对于数据的形式主要包含以下几个属性x 节点特征矩阵,形状为[num_nodes, num_node_features]一、GCN普通的图卷积算子主要来源于“Semi-supervised Classification with Graph Convolutional Networks” ,笔者在深入浅出了解GCN原

2021-04-14 18:19:32 1926 1

原创 使用huggingface的Transformers预训练自己的bert模型+FineTuning

将“softmax+交叉熵”推广到多标签分类问题:https://zhuanlan.zhihu.com/p/138117543SGMhttps://github.com/lancopku/SGM

2021-04-13 15:40:55 34027 49

原创 使用HEXO+github.io 搭建自己的博客

这里主要参考这个教程,写的非常详细了和一些问题的解决:使用GitHub和Hexo搭建免费静态Blog其中笔者遇到的问题是再hexo d 的时候跟新不上去,解决问题是:将_config.yml文件repository地方由原来的https://github.com/zhangxiangqiang/zhangxiangqiang.github.io.git 换成[email protected]:zhangxiangqiang/zhangxiangqiang.github.io.git ,当然别忘了前面是有个

2021-04-05 21:42:40 198

原创 多分类问题引申到多标签分类问题(softmax+交叉熵)

最近在关注和参与了一些NLP的比赛,因为我做NLP的比赛的经验不多,所以过程中还是学习到不少知识,虽然目前名次不是特别好,但前排大佬们的分享还是能get到很多想法和知识的。今天介绍的是苏神(苏剑林)的一篇文章,本文仅仅是笔者个人的解读和思考,如有错误,还望读者指正。  在很多类型的比赛,包括NLP的比赛中,往往会有多标签分类的问题,所谓多标签分类,就是一个样本会有多个类别属性的标签,例如:在心电的疾病诊断中,一个患者可能同时患有一种或多种类型的心脏疾病。不同于多分类任务,一般来说,我们可以把多标签任.

2021-04-01 17:37:19 1701 1

原创 pandas 将DataFrame 转为txt文本,用以预训练,去除引号问题

由于需要训练glove embedding,需要自己创建语料库用以训练,我是用pandas读取处理的,需要保存为.txt文件给模型训练。原本是传统的open(‘xxx.txt’,‘w’) 然后一条条语句写进去就可以了,但是pandas很好的网格特性,直接保存不是很省事,但是在保存的时候发现,原本的字符,会把引号也保存了,比如字符串 sddb 保存后为 “sddb” 显然不合理,这里一种解决办法:import csvdata[1].to_csv('excel2txt.txt', sep=' ', inde

2021-03-21 11:03:58 4731

原创 python安装pytorch,torch_geometric ,torch_scatter,“No module named” 版本问题

一般的安装问题是版本导致的,torch与python的版本要对应,如果你是py3.8 py3.9版本 ,可能会因为python版本过高而安装失败。这里建议的是python版本在3.6,3.7 ,torch的版本建议1.5.0~1.7.0我目前用的是py3.6 和torch1.51 ,版本不一定要最新的,满足自己功能就行。笔者一般喜欢用pip安装和管理包,这个是python自带的,安装时候会自动添加到系统的环境变量,如果没有自己手动添加环境变量就可以了,添加的地址在python安装的目录下的scrip

2020-12-12 15:01:29 6125 6

原创 R语言的MoMA安装以及相关包的安装

R语言的MoMA安装#MoMA是一个惩罚SVD框架,支持广泛的稀疏诱导惩罚。对于矩阵X, MoMA给出了多种优化问题的求解因为实验室有用到MoMA这个包,但是这个不是R里面传统的包,需要自己额外下载,所以折腾了挺久,好在之前保存了github的链接,这里记录下,按照里面的提示来安装就可以了。注意下R的版本要和Rtool的要一致,我这里用了4.0的版本。github:MoMA主要用到这两句命令:library(devtools)install_github("DataSlingers/MoMA",

2020-10-10 19:07:52 313

原创 2020中国高校计算机大赛·华为云大数据挑战赛-数据分析(二)

2020中国高校计算机大赛·华为云大数据挑战赛-数据分析(二)这里继续上次的分析,上一篇我们主要分析了数据的结构,现在我们着重看下数据的gps。一、行船轨迹这里我们话了几张相同trace的行船记录,看看他们的轨迹是否一致,为了和test保持一致,我画了出现在test里面的trace.上面的轨迹图可以看出,一些轨迹还是比较规整的,但是一部分轨迹是存在不一致的,有的船可能因为总总原因,并不是按原路线行驶,甚至会有提前登陆的情况,这种情况在test可能也会发生。为此 我们在看看test里面截断的路

2020-06-22 20:25:12 4091 17

原创 2020中国高校计算机大赛·华为云大数据挑战赛-数据分析(一)

2020中国高校计算机大赛·华为云大数据挑战赛–数据分析(一)正式赛已经开始几天了,但这几天有很多事要忙,所以每什么时间来做比赛,昨天把数据下下来,结合论坛里某个小伙伴的baseline简单分析了下数据。把一些自己的分析记录在下面,供大家参考,同时能有所启发得到一些解题的思路。首先这里放上baseline的链接,感谢姜大德的分享,提供了一份完整的从载入数据,处理数据到训练模型和提交的完整步骤!basline链接一、baselinebaseline看过后基本上可以把整个数据处理流程和提交理清楚了,这

2020-06-04 22:07:15 10437 37

原创 2020中国高校计算机大赛·华为云大数据挑战赛--热身赛 Rank7 思路及代码分享

队名:无能万金油2020中国高校计算机大赛·华为云大数据挑战赛–热身赛热身赛:Rank 7CSDN博客:我的博客数据相关知识和分析参考:[上分指南] 2020华为云大数据挑战赛热身赛如何“未卜先知”Github代码:2020华为云热身赛(建议直接下载热身赛code.ipynb,里面有详细代码分析说明)比赛地址:华为云大数据挑战赛–热身赛赛题说明热身赛题——交通流量预测随着电子信息和移动通信技术高速发展和不断融合,人工智能在各个领域都相继取得了巨大的突破,城市智能体也应运而生,而城市交

2020-06-02 15:54:56 3249 3

原创 面试中遇到的编程题

给定一个序列,找出序列的最长递增子序列的长度比如[10,9,2,4,5,141,6,2,9],最长子序列是[2,4,5,6,9]输出5(长度为5)def genmax(nums): dp=[1 for k in nums] for i in range(1,len(nums)): maxs=dp[i-1] for k in range(...

2020-03-18 23:51:20 347

原创 本地使用远程服务器的jupyter notebook 以及其他问题记录

在网上查找了很多资料,试了很多方法,踩了不少坑,现在记录下最终的可行方案。主要参考这2篇:https://cloud.tencent.com/developer/article/1488507 https://www.cnblogs.com/qiangzi0221/p/8933722.html1、生成配置文件,有的服务器是已经生成了配置文...

2020-02-27 12:39:34 1431

原创 window 下用cmd使用ssh 教程(踩的坑总结)

首先需要安装openssh :https://github.com/PowerShell/Win32-OpenSSH/releases1、进入链接下载最新 OpenSSH-Win64.zip(64位系统),解压至C:\Program Files\OpenSSH2、打开cmd,cd进入C:\Program Files\OpenSSH(安装目录),执行命令:powershell.exe ...

2020-02-27 12:12:24 11536 2

原创 letcode:287. 寻找重复数:弗洛伊德的乌龟和兔子

**给定一个包含 n + 1 个整数的数组 nums,其数字都在 1 到 n 之间(包括 1 和 n),可知至少存在一个重复的整数。假设只有一个重复的整数,找出这个重复的数**其他解法就不说了,没什么,重点说下快慢指针乌龟和兔子这个的思想和证明,我第一次看到这种方法的时候,完全不知道为什么可以这样能找出答案。经过百度和几个小时的思考才想明白。针对这道题,由于值是1~ n 且有n+1个数,那...

2020-01-06 16:37:49 667

原创 本地查看远程服务器的tensorboard方法

首先你要用可以使用ssh的工具比如putty,xshell,termius 等,来连接到远程服务器,连接的命令:ssh -L 16006:127.0.0.1:6006 name@ip -p 22 # 你的用户名name和ip 有的服务器做了端口映射 所以-p后面添加你服务器的连接端口号,默认是22端口 输入上面的命令之后,服务器会要求你输入账户密码登入登入之后再终端输入:...

2020-01-03 20:43:46 4653

原创 python装饰器及warp的作用

很久以前就有看过装饰器的用法和功能,但是自己平时在编程的时候基本上很少用到这些高级的用法。今天看别人开源的efficientDet的源码时,很多地方用了装饰器,一时想不起来具体作用了,所以又百度学习了一波。现在以我个人理解总结下,以便日后忘记可以在复习下。首先装饰器是python一个很强大的功能,也是动态编程的一个特点。首先我们知道,在python中一个函数可以作为参数传给另外一个函数:...

2020-01-02 12:42:00 1971

原创 图像分割:FDDWNET:一种轻量级的分割网络

FDDWNET: A LIGHTWEIGHT CONVOLUTIONAL NEURAL NETWORK FOR REAL-TIME SEMANTIC SEGMENTATION发表时间:2019.11.07作者团队:南京有点大学论文连接:FDDWNET: A LIGHTWEIGHT CONVOLUTIONAL NEURAL NETWORK FOR REAL-TIME SEMANTIC SEGM...

2019-12-22 16:48:27 3053 1

原创 目标检测:一、YOLOV3: tf,keras版本 从0开始解读源码

从0开始入手目标检测YOLO V3算是我入手目标检测第一个学习的网络,里面很多概念比如anchor,也是看源码之后学到的,感兴趣的可以看看yolo系列从V1~V3,来了解下这个领域的一些问题和技术。当然,了解一个技术最好最快的方式就是阅读论文和看源码。原文:YOLOV3完整的代码见:YOLOV3-keras开始之前引入各个模块:"""YOLO_v3 Model Defined in K...

2019-12-22 14:35:37 870

原创 推荐系统探索:一、DeepCtr模型

一、深度CTR预估模型的演化之路2019最新进展

2019-12-19 14:01:02 406

原创 NLP探索:一、从Word2vec到Bert

这篇主要记录自己在入手NLP时候,看到的不错的文章或者代码。初探NLP,Word Embedding:1、这篇微信长文写的非常棒!就是图片不清晰, 结合bert原文小白就可以入手:从Word Embedding到Bert模型——自然语言处理预训练技术发展史...

2019-12-17 13:55:54 337 1

原创 一、论文解读(推荐系统):DeepFM

dEEPFM 论文阅读                 学习复杂的功能交互背后的用户行为是至关重要的对于最大化CTR推荐系统。现存的模型对于低阶或高阶的特征交互有很强的依赖,需要专家做大量的特征工程。在这篇文章中,我们表示同时注重低阶核高阶的特征交互的端到端的学习模型是可能的。DeepFM结合了因子分解机的推荐能力以及深度学习的特征学习能力,形成了一种新的神经网络结构,比较谷...

2019-12-16 14:23:59 611

原创 LeteCode:19. 删除链表的倒数第N个节点

给定一个链表,删除链表的倒数第 n 个节点,并且返回链表的头结点。示例:给定一个链表: 1->2->3->4->5, 和 n = 2.当删除了倒数第二个节点后,链表变为 1->2->3->5.说明:给定的 n 保证是有效的。进阶:你能尝试使用一趟扫描实现吗?来源:力扣(LeetCode)链接:https://leetcode-cn...

2019-12-15 20:51:05 253

原创 LeteCode:12. 整数转罗马数字

罗马数字包含以下七种字符: I, V, X, L,C,D 和 M。字符 数值I 1V 5X 10L 50C 100D 500M 1000例如, 罗马数字 2 写做 II ,即为两个并列的 1。12...

2019-12-09 18:17:30 129

原创 LeteCode刷题:416. 分割等和子集(中等难度)

给定一个只包含正整数的非空数组。是否可以将这个数组分割成两个子集,使得两个子集的元素和相等。注意:每个数组中的元素不会超过 100数组的大小不会超过 200示例 1:输入: [1, 5, 11, 5]输出: true解释: 数组可以分割成 [1, 5, 5] 和 [11].示例 2:输入: [1, 2, 3, 5]输出: false解释: 数组不能分割成两个元素...

2019-12-04 11:06:45 228

原创 LeteCode刷题:415. 字符串相加

给定两个字符串形式的非负整数 num1 和num2 ,计算它们的和。注意:num1 和num2 的长度都小于 5100.num1 和num2 都只包含数字 0-9.num1 和num2 都不包含任何前导零。你不能使用任何內建 BigInteger 库, 也不能直接将输入的字符串转换为整数形式。来源:力扣(LeetCode)链接:https://leetcode-cn.com/...

2019-12-02 15:37:29 124

原创 Letecode:258. 各位相加

Letecode:258. 各位相加给定一个非负整数 num,反复将各个位上的数字相加,直到结果为一位数。示例:输入: 38输出: 2解释: 各位相加的过程为:3 + 8 = 11, 1 + 1 = 2。 由于 2 是一位数,所以返回 2。进阶:你可以不使用循环或者递归,且在 O(1) 时间复杂度内解决这个问题吗?来源:力扣(LeetCode)链接:https://l...

2019-12-01 15:15:54 172

原创 Letcode刷题:67. 二进制求和(python)

给定两个二进制字符串,返回他们的和(用二进制表示)。输入为非空字符串且只包含数字 1 和 0。示例 1:输入: a = “11”, b = “1”输出: “100”示例 2:输入: a = “1010”, b = “1011”输出: “10101”来源:力扣(LeetCode)链接:https://leetcode-cn.com/problems/add-binary...

2019-12-01 12:58:26 259

转载 Ubuntu下python2,python3版本问题 用命令行默认python版本

参考:https://www.cnblogs.com/wangyarui/p/9103286.html

2019-07-30 18:57:33 185

canvas制作星系

html制作太阳系,通过canvas来模拟三D旋转效果 html制作太阳系,通过canvas来模拟三D旋转效果 html制作太阳系,通过canvas来模拟三D旋转效果

2018-07-29

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除