study
Wisley.Wang
这个作者很懒,什么都没留下…
展开
-
天池比赛如何使用docker提交
天池上的比赛,一般复赛阶段会让参赛选手使用docker封装好容器后,提交到线上得到结果,推理或者训练过程放在赛方提供的硬件环境下,选手一般是接触不到测试集的,更加保证了比赛的公平性。 笔者接触docker和使用已经有几次了经历了,但是都只是用于比赛,所以平时并不常使用,导致每次用的时候都要在查查资料回顾下,现在记录一下主要的提交步骤,以遍日后复习使用。一、机制天池平台提供了基于GPU计算资源的提交镜像的方式,将本地代码打包成镜像提交,推送至阿里云容器镜像仓库后,在天池提交页面中输入镜像地址、用户名.原创 2021-04-15 23:02:04 · 1857 阅读 · 2 评论 -
使用HEXO+github.io 搭建自己的博客
这里主要参考这个教程,写的非常详细了和一些问题的解决:使用GitHub和Hexo搭建免费静态Blog其中笔者遇到的问题是再hexo d 的时候跟新不上去,解决问题是:将_config.yml文件repository地方由原来的https://github.com/zhangxiangqiang/zhangxiangqiang.github.io.git 换成rgit@github.com:zhangxiangqiang/zhangxiangqiang.github.io.git ,当然别忘了前面是有个原创 2021-04-05 21:42:40 · 279 阅读 · 0 评论 -
pandas 将DataFrame 转为txt文本,用以预训练,去除引号问题
由于需要训练glove embedding,需要自己创建语料库用以训练,我是用pandas读取处理的,需要保存为.txt文件给模型训练。原本是传统的open(‘xxx.txt’,‘w’) 然后一条条语句写进去就可以了,但是pandas很好的网格特性,直接保存不是很省事,但是在保存的时候发现,原本的字符,会把引号也保存了,比如字符串 sddb 保存后为 “sddb” 显然不合理,这里一种解决办法:import csvdata[1].to_csv('excel2txt.txt', sep=' ', inde原创 2021-03-21 11:03:58 · 4886 阅读 · 0 评论 -
几种GNN模型的应用与改进
近期又陆续看了一些关于GNN的文章,这些文章总体上都是想要解决一个问题,就是如何从大规模图数据中,能有效嵌入节点和拓扑结构的信息,同时降低计算的复杂度,缓解过拟合的风险。有效地对图结构数据的节点进行embedding就需要考虑数据本身的特征,同时也要考虑不同应用场景以及下游任务的目标。在实际场景中,图数据本身就是错综复杂的,节点直接的联系有些是我们可以从先验知识中得到的,有些是无法直接定义,或者需要从模型中隐式地学习。关于图的描述和学习就有很多方法,比如从邻近的定义有deepwalk、Node2Vec、m原创 2020-11-20 15:31:56 · 3943 阅读 · 0 评论 -
深入浅出了解GNN的几种变体
接上篇博客,这周主要学习了GraphSAGE,GAT,R-GCN 三种GNN的变体模型,从空域的角度出发,对节点的嵌入表征进行了深入的研究。**(本文作为笔者的学习笔记,如有错误,希望各位读者批评指正)**原创 2020-11-08 11:31:41 · 3602 阅读 · 4 评论 -
R语言的MoMA安装以及相关包的安装
R语言的MoMA安装#MoMA是一个惩罚SVD框架,支持广泛的稀疏诱导惩罚。对于矩阵X, MoMA给出了多种优化问题的求解因为实验室有用到MoMA这个包,但是这个不是R里面传统的包,需要自己额外下载,所以折腾了挺久,好在之前保存了github的链接,这里记录下,按照里面的提示来安装就可以了。注意下R的版本要和Rtool的要一致,我这里用了4.0的版本。github:MoMA主要用到这两句命令:library(devtools)install_github("DataSlingers/MoMA",原创 2020-10-10 19:07:52 · 385 阅读 · 0 评论 -
面试中遇到的编程题
给定一个序列,找出序列的最长递增子序列的长度比如[10,9,2,4,5,141,6,2,9],最长子序列是[2,4,5,6,9]输出5(长度为5)def genmax(nums): dp=[1 for k in nums] for i in range(1,len(nums)): maxs=dp[i-1] for k in range(...原创 2020-03-18 23:51:20 · 383 阅读 · 0 评论 -
机器学习-EM算法通俗详解
本篇参考了白板推导系列以及其他关于EM算法的书籍,尽力做到通俗易懂,我第一次学习的时候也是各种混乱,尤其是在学习完理论之后,具体实践和代码实现都还是很模糊。在查阅了多方资料,和各种大神的博客之后,终于算是弄懂了,在此集百家之长,站在巨人的肩膀上,总结和推导下EM的从始到终,如果不足之处还望多多指正。一、为什么使用EM算法(什么情况下使用)在学习一个知识的时候,我认为最关键的是要知道我们为什么学...原创 2020-03-15 13:07:18 · 545 阅读 · 0 评论 -
本地使用远程服务器的jupyter notebook 以及其他问题记录
在网上查找了很多资料,试了很多方法,踩了不少坑,现在记录下最终的可行方案。主要参考这2篇:https://cloud.tencent.com/developer/article/1488507 https://www.cnblogs.com/qiangzi0221/p/8933722.html1、生成配置文件,有的服务器是已经生成了配置文...原创 2020-02-27 12:39:34 · 1515 阅读 · 0 评论 -
window 下用cmd使用ssh 教程(踩的坑总结)
首先需要安装openssh :https://github.com/PowerShell/Win32-OpenSSH/releases1、进入链接下载最新 OpenSSH-Win64.zip(64位系统),解压至C:\Program Files\OpenSSH2、打开cmd,cd进入C:\Program Files\OpenSSH(安装目录),执行命令:powershell.exe ...原创 2020-02-27 12:12:24 · 11820 阅读 · 2 评论 -
C++笔记 二位数组指针
这里不做过多的说明了,主要有几点概念要搞清楚i行地址i行首地址i行j列元素地址i行i列元素需要明确的一点是,i行地址与i行首地址在值上是相等的,但是两个是不同类型的东西,可以说行地址是行首地址的指针,而行首地址是元素的指针,所以行地址其实就是指针的指针。一个a[m][n]的二维数组:i行地址:a+i , &a[i]i行首地址: a[i] , &a[...原创 2018-09-08 22:25:58 · 281 阅读 · 0 评论 -
MIT 第二章 矩阵思考笔记
我们都知道,要对非齐次方程求解,首先得对矩阵进行初等行变化,化成阶梯型矩阵,得到变量与值的关系求解。而初等行变化,相当于左乘一个初等矩阵(单位矩阵进行相应的行变换)。那么,问题来了。为什么对其进行行变换就相当于左乘初等阵呢? 我们只是从书上看到这个结论,但并不太清楚为什么会是这样的,接下来的举例或许对你有所启发.现在先让我们回顾下,首先,矩阵相乘,两个矩阵必须满足:左列数=右行数。...原创 2018-09-08 22:00:45 · 511 阅读 · 0 评论