自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

庆述倾述

万物轮转,周天复始

  • 博客(309)
  • 资源 (4)
  • 收藏
  • 关注

原创 数据结构889考研真题练习册

资料挺好的,是圆梦考研出版的。最终数据结构的成绩是108,虽然最终没有考上北理。对了,2018年12月考889的题型较往年多了两个类型的题目:外排序另外一个记不得了,可以去王道论坛找找经验贴。这里就直接给出我做好的PDF的百度云链接吧:链接: https://pan.baidu.com/s/1n8xUqXdJi-74BIfNPtOvQA 提取码: 2qss微信来...

2019-04-02 08:34:37 1203 5

原创 关于随机游走的一个小实验

实验目的:阅读源码DeepWalk中的随机游走算法,然后单独抽离出来,做训练语料库,然后学习每个节点的向量表示,最后计算相似度,统计,并得出逻辑上的意见领袖节点(基于上面的那个相似观点来的)。代码如下:import random as randdef getPath(start, nx_G, path_length, alpha): if start: path = [start] else: # Sampling is uniform w.r.t V

2020-11-17 14:48:00 9

原创 Git版本控制工具(二)

这里写一下在实际中常用到的一些git命令。检查配置的用户名和邮箱信息# 可使用list命令查看全部git config --list # 可单独指定git config user.namegit config user.email通常我们可能会忘记配置的github的邮箱以及用户名,以上命令可以比较方便的查看。然后,配置之前讲过,这里还是粘贴下:git config --global user.name "xxx"git config --global user.email test

2020-11-17 09:37:48 10

原创 研究生生活断代史(六)

2020年11月15日    今天或许是新的纪元开创日,和以前的朋友以及老姐又聊了聊,发现自己真的是弱爆了。或许之前的自己一直所想追寻的不是什么咸鱼的生活,而是一直想生活过于理想化。希望有理想的环境,有着不切实际的世界观,想追寻的是一种平衡的世界观。但终究从今天看来太过于梦幻!借用饲养全人类中的说法,所以命名今天为纪元开创日,以纪念懵懂无知的过去,以及多未来的寄托。    从6月来到学校,回顾这五个多月的时间,这段平凡而又充实但又有些迷茫的岁月,确也值得我自己铭记。5月底外接了一个小程序项目,然后开.

2020-11-15 16:14:40 36

原创 研究生生活断代史(五)

    又来了,看了看上篇的日期,大约隔离20天的时间。或许还不错,因为总是独处或者有些生活感触的时候才会想到来吐吐槽。上两周的生活如梦幻般,时光总是飞快的驶过,而留下的仅仅是一颗焦灼的心。    是的,又是不想学习的一天,似乎只有看看小说、喝一罐啤酒才能找到内心的慰藉。两周前搞了一个自己所谓的“基于节点重要程度的网络嵌入”,但其效果其实不好,甚至与在前两周的时间中看了比较多的结构相关的预留方法,却了不了了之。总想验证什么东西,但之前内心却也不能接受结果,最终却也不敢验证已有的结果。也好,或许这也是最好的

2020-11-12 19:45:57 29

原创 python 字典按照值排序,并返回前K个

# 字典按照value排序def getTopK(dict_, K = 10): keys = list(dict_.keys()) for key_i in range(len(keys)): for key_j in range(key_i+1, len(keys)): if dict_[keys[key_i]] < dict_[keys[key_j]]: temp = keys[key_i]

2020-11-03 09:00:21 22

原创 Git版本控制工具

Git 是一个开源的分布式版本控制系统,用于敏捷高效地处理任何或小或大的项目。1. 下载可访问:国内镜像如:Git-2.10.1-64-bit.exe2. Git 配置可以再三个地方配置,分别是:/etc/gitconfig 文件~/.gitconfig 文件当前项目的 Git 目录中的配置文件(也就是工作目录中的 .git/config 文件)在 Windows 系统中,Git 会找寻用户主目录下的 .gitconfig 文件。2.1 配置用户信息如:$ git config

2020-11-01 11:14:07 21

原创 研究生生活断代史(四)

    上周和老姐度过了25岁的生日,总觉得自己会在新的征程里面有所不同或者说是有所成长。但是,事实上就是最近的自己和以前的我其实没有一丝丝差别。该看小说看小说,卸载的和平精英又安装回来了,对于论文还是没有进展。    总觉得自己应该有所不同,或者说应该有所坚持。    一直都觉得自己不在状态,从考研开始就有这个感觉,一直都觉得自己还没有准备好。现在回想起来,自己又什么时候准备好过,从来都是内心怕失败,而有各种理由不去尝试。这,也许就是最大的失败吧。当觉得自己准备好了的时候,时间已经错过,并不可从来。过

2020-10-24 23:00:58 223

原创 研究生生活断代史(三)

感觉今天又开心了一波,又一次吐槽了很久自己的老师,哈哈哈。。。虽然开心了,但是不得不说老师他还是很牛逼的,因为他现在的生活是我的奋斗的终点。虽然实验室不适合学习,但不得不说却是生活还是很高兴的。难受的就在于明年的这个时候,我要靠什么来申请博士?这就很扎心了,虽然耍的挺开心,但是自己确实还是没有进展,也还没有任何的成果出来,所以还是比较慌的。其实,有些时候就是搞不清楚自己的定位,搞不明白自己所处的位置,才会对一些虚无缥缈的东西抱有幻想。如果一开始不抱有幻想,或许现在对老师的落差感就没有那么大。不过,无论

2020-10-21 21:29:10 28

原创 研究生生活断代史(二)

其实也就是接下来几天的工作安排。最近一段时间看的网络表示学习的文章,大多都提及了一些DeepWalk、Node2vec、LINE、GraRep、SDNE等方法,有篇文章中将这些方法进行了整理,如下图:来源于论文:《Representation Learning for Attributed Multiplex Heterogeneous Network 》论文下载地址:https://arxiv.org/pdf/1905.01669.pdf前段时间也看了一些同质网络中的属性网络嵌入,以及前面所提及

2020-10-20 19:44:17 31

原创 负采样策略

前言    在多篇论文中均提及到了负采样策略,那么就来简单学习下什么是负采样策略。偶然搜到了两篇大佬的文章:负采样算法神经网络中的负采样顺便一提,找到了一个很nice的网站,看了网站的关于部分:算法初心者。白天生存,晚上生活。没有任何光鲜的经历,也没有任何过去的回忆。无论是互联网还是现实中,都不会保留任何“过去”的东西。喜欢有思想深度的事物,讨厌浮躁、拜金与安逸的人。对外面的世界失去了兴趣,希望一直活在“心境”里。爱了,爱了!!!希望向大佬靠拢。接着,来简单综合下负采样。正

2020-10-19 19:46:46 27

原创 内容增强网络表示学习的一般框架(A General Framework for Content-enhanced Network Representation Learning)(4)

再次整理下思路,因为上一篇整错了。1)表示整个网络,包括node-node和node-content;2)使用node2vec学习的是原本的节点的表示,不是虚拟的节点的表示,即不将1中的整体图用来做随机游走;3)使用sent2vec学习虚拟节点的嵌入表示,即内容;存在问题node2vec中有个函数写错了,导致某些节点总学习不到其向量表示,即:def learn_embeddings(walks): # storage ⇒ 这里的存储和for循环,之前写反了 filename =

2020-10-15 14:36:37 40

原创 研究生生活断代史(一)

前言刚刚想向往常一样来写一篇日常吐槽和思考,以及近期的状态等。然后,想着自己所处的研二的阶段,貌似可以来记录下自己的一些对生活的思考和对自己的反省,留给以后的自己娱乐。笑笑曾经的幼稚的自己。吐槽It's a tough day today!总是想入非非,又总是自命不凡,而实际上自己却是菜的抠脚。现实一次又一次的打脸告诉自己,自己的那些有的没的想法是多么可笑,而自己还的笑呵呵承认。很多次,自己都处于一个奔溃的边缘,很多次自己都很想大哭一场,很多次都多想告诉自己这只是一场梦。而现实就是如此,没人会在乎

2020-10-13 21:56:15 68 1

原创 内容增强网络表示学习的一般框架(A General Framework for Content-enhanced Network Representation Learning)(3)

在上篇内容增强网络表示学习的一般框架(A General Framework for Content-enhanced Network Representation Learning)(2)对整个网络进行了简单的处理,得到了一个边集关系的文件,我们接下来的节点表示工作,就基于该数据集,当然,要进行将孤立节点也整进去。这里,将使用node2vec来进行嵌入操作,因为这个算法可以看作是对DeepWalk的一个扩展,也比较成熟。简单抄抄介绍:node2vec是一种综合考虑DFS邻域和BFS邻域的graph

2020-10-11 15:03:08 37

原创 内容增强网络表示学习的一般框架(A General Framework for Content-enhanced Network Representation Learning)(2)

在上篇内容增强网络表示学习的一般框架(A General Framework for Content-enhanced Network Representation Learning)(1)中,我们可以了解到这个学习框架的基本构成,这篇文章就来简单的实现下。前提假设即:SPSPSP 是通过随机游走所生成的路径上的邻接节点对;SNSNSN 是所有的负采样的集合;节点eue_ueu​的数值化表示为节点的嵌入表示,类似与DeepWalk、node2vec等任务1)整合node-node连接、nod

2020-10-10 20:17:56 37

原创 内容增强网络表示学习的一般框架(A General Framework for Content-enhanced Network Representation Learning)(1)

题目A General Framework for Content-enhanced Network Representation Learning题目分析(analysis):1)结构+内容的Network Embedding;2)Content-enhanced,应该注意内容如何enhance;摘要现有的网络嵌入方法大多只依赖于网络结构,而忽视了能够代表这个节点的丰富的相关文本信息。本文提出内容增强网络嵌入(CENE),来联合学习这两个部分的信息。该方法将内容信息作为一种特殊的节点来处理,将

2020-10-09 20:17:43 36

原创 GRU(Gated Recurrent Unit)初探

在处理序列任务的时候,由于RNN存在梯度消失和梯度爆炸的原因:梯度消失:RNN梯度消失是因为激活函数tanh函数的倒数在0到1之间,反向传播时更新前面时刻的参数时,当参数W初始化为小于1的数,则多个(tanh函数’ * W)相乘,将导致求得的偏导极小(小于1的数连乘),从而导致梯度消失。梯度爆炸:当参数初始化为足够大,使得tanh函数的倒数乘以W大于1,则将导致偏导极大(大于1的数连乘),从而导致梯度爆炸。LSTM在1997年就提出来,通过门控单元来解决这个问题。在2014年GRU提出,相比LST

2020-10-09 16:13:02 36

原创 DeepWalk粗解

本文将图网络上随机游走(Random Walk)和自然语言处理中的skip-gram语言模型相结合起来,而产生了在网络表示学习(Network Embedding)在与NLP相结合的第一篇开山之作。理论支撑也即是在无标度网络中,网络中节点的度分布服从幂律分布。而在此网络中采样后的节点出现频率也服从幂律分布,类似的在将文本进行随机游走的时候同样服从幂律分布。故而这种随机游走的采样没有改变网络整体的结构,是合理的(网络的特性与自然语言处理中的特性十分类似)。方法从一个节点v4v_4v4​出发,进

2020-10-08 15:37:18 22

原创 DeepWalk初探

欲实现下面的一个效果:数据集的获取,可以利用networkx中的集成的Karate图来得到,获取数据集到原始的CSV文件,在上篇(处理数据的常见操作)中有介绍,这里不再介绍。那么,首先我们需要使用louvain算法来进行这个数据集的社区的划分,同样的前面也介绍过,这里不再重复。这里直接改变划分后的节点的颜色即可,代码如下:import community as community_louvainimport matplotlib.cm as cmimport matplotlib.pyplot

2020-10-07 22:24:53 26

原创 处理数据的常见操作

pandas存储数据到csv文件中import pandas as pd#任意的多组列表a = [1,2,3]b = [4,5,6] df = pd.DataFrame({'a_name':a,'b_name':b})#index表示是否显示行名,default=Truedf.to_csv("test.csv",index=False,sep=',')numpy 提取矩阵的某一行或某一列行众所周知可以用下标取得,其实就是列比较新奇:arr = np.array([[1.

2020-10-07 15:07:37 24

原创 SIR模型的应用(2) - Influence maximization in social networks based on TOPSIS(3)

上篇中我们说道了,需要注意作者是如何将SIR应用到种子节点的传播过程之中的。那么我们就来看看作者是如何做的。思考不妨先思考下:① 初始时刻,处于I状态的是种子节点,其余节点是易感节点;② 在进行传播时,传播的途径是节点之间的连接边;也就是在SIR模型进行传播的时候,需要满足两个条件:1)该节点到目标节点之间有直接连接边;2)待传播节点是易感节点,即S;文中均匀模型,图中所有边的传播概率均是β;基于度的模型,节点v到节点u的传播概率可以计算为1/du1/d_u1/du​思考由于,我们

2020-10-04 20:23:09 78 1

原创 SIR模型的应用 - Influence maximization in social networks based on TOPSIS(3)

在Influence maximization in social networks based on TOPSIS一文中,作者利用SIR模型如下:即:种子节点处于感染阶段,其余节点处于易感,最终的评判以网络中恢复的人数来判断。那么,不妨来了解下SIR模型是如何工作的。SIR模型经典的SIR模型提出比较早,我们都知道它存在三种状态,分别是:Susceptible:易感人群,指未得病者,但缺乏免疫能力,与感病者接触后容易受到感染;Infective:感染人群,指染上传染病的人,他可以传播给易感人

2020-10-03 16:37:33 86

原创 深思

总是需要一些点,来刺激下自己的灵魂,才能达到自我反省的目的。确实自己也接收了一些点。在get到的时候,大脑里不禁问自己:你能拿的出手的是什么?你的核心竞争力是什么?你的奋斗目的是什么?现在为之做了哪些努力?你是否能接受失败,或者说是否承受的了将来的失败的后果?我的确心虚了,自己心底潜意思的提问,我自己都回答不了,一个都回答不了。选择安逸,就会迷失方向,而我自己却不知道迷失了多久了。有了方向,就应该坚定航向,无论未来如何,努力做出自己的一份成就。成功的人,找原因;失败的人,找借口;还有一类人,借口都

2020-10-02 09:25:00 56

原创 关于上两篇文章的思考

今天读论文,在Influence Maximization on Large-scale Networks with a Group-based Method via Network Embedding一文中,提出了diffusion-aware random walk sampling strategy。回顾在Community aware random walk for network embedding一文中提出了Community aware random walk sampling strateg

2020-09-30 10:05:42 23

原创 Influence maximization in social networks based on TOPSIS(2)

按照上一篇中所描述的算法逻辑和相关的伪代码,可以得到在文中所定义的初始决策矩阵A,即:同样的,所用数据集是karate_club_graph数据集,其图形之前绘制过,如下图:在jupyter notebook中运行,可以比较方便的看到这个矩阵的结构:注意这个矩阵的名称,叫做(decision matrix)决策矩阵,结合TOPSIS法(优劣解距离法)介绍及 python3 实现一文中的详细解释TOPSIS算法,我们知道,可以直接将我们得到的初始决策矩阵用来作为判别的四个指标。但有点不想写top

2020-09-29 16:48:11 52

原创 Influence maximization in social networks based on TOPSIS(1)

今天发现了一个社交网络数据集网站:Network data对于这篇文章Influence maximization in social networks based on TOPSIS,在早些时候,就看见了CSDN上的大佬实现了这个文章的代码。但是,在这里还是想自己来复现下,加入自己的一些粗浅的见解。就来再读一下,然后实现代码逻辑功能。提出的原因IM问题,常常都是考虑如何选择特定的有影响力的用户作为种子节点,而往往忽视了所选择用户之间的距离(distances),它可以用来确保对大规模社交网络的最小重

2020-09-29 09:04:39 53

原创 Community aware random walk(2)

在上篇Community aware random walk虽然使用了gensim中封装好的word2vec来大致实现了这个算法,但是实际上和论文中的框架图还是有很大的区别的,如下图:从图中可以看出,文中使用word2vec得到的是这个节点的一个网络嵌入表示,也即是一个行向量。而我在使用gensim来实现的时候,实际上输出的是一些最相似的点集,代码如下:# 加载生成的语料库,输入到skipgram模型中,用于计算K相似def generate(): sentences = word2vec.

2020-09-28 10:32:44 37

原创 Community aware random walk

Community aware random walk for network embedding该文中提出了一中网络嵌入方法,来解决本地和全局的网络结构信息的保留。可以简单的理解为:通过算法2来从整个图中随机游走获得游走序列,然后将这个序列输入到Skip-gram算法中, 然后可以得到该序列的一个vxd中的一个行或者列向量表示(算法1),最终这些向量构成U矩阵,也就是整个网络的网络嵌入表示。在2019年,本文作者将这个方法应用在了Influence maximization across het

2020-09-26 15:01:39 53

原创 非标准程序员的日常

好像自己是一直都在找存在感,一直都是想东想西。做事又想着公平,而又自己觉得经历这非公平的待遇。总是自怨自艾,患得患失。虽然没什么可失去,但却总是在东西之间徘徊。总而言之,好像自己就是没什么方向,做事目的性不强,总是畏首畏尾。简而言之,就是想的太多,做的太少。——————转眼,已经事9月底了,研一的新生已经来实验室报道,并在今天开了一个比较正式的学术分享会议。荣升研二的我,却感觉自己配不上这个词。深深的理解什么是时间推着你前进,什么是光阴如箭、日月如梭。感觉,在最近的这些日子里,自己的心还是没有静下来

2020-09-25 20:04:17 57

原创 验证码图像识别

PIL+tesserocrpip install pillowpip install pytesseractPIL进行预处理。经历步骤:灰度化->降噪(去除噪声)->二值化->分割->识别灰度处理from PIL import Imageimport numpy as npimport matplotlib.pyplot as pltimg = Image.open('1.png')img = np.array(img)print(img)if im

2020-09-24 20:30:52 41

原创 关于gensim的一些使用记录

NLP神器Gensim是一款开源的第三方Python工具包,用于从原始的非结构化的文本中,无监督地学习到文本隐层的主题向量表达。支持包括TF-IDF,潜在语义分析(Latent Semantic Analysis,LSA),潜狄利克雷分布(Latent Dirichlet Allocation,LDA),和word2vec在内的多种主题模型算法,支持流式训练,并提供了诸如相似度计算,信息检索等一些常用任务的API接口。概述概念名称说明语料(Corpus)数字化文档的集合,被用

2020-09-24 09:06:50 21

原创 python-louvain

安装louvain当前最新版本:0.14pip install python-louvain由于是处理社区的数据,这里还是安装networkxpip install networkx使用不妨来运行下一个案例:import community as community_louvainimport matplotlib.cm as cmimport matplotlib.pyplot as pltimport networkx as nx# load the karate club

2020-09-23 15:46:15 255 3

原创 Android侧滑

网上有很多关于侧滑的实现,看到了《Android 打造完美的侧滑菜单/侧滑View控件》,该文提到的思想的确是简单易懂,核心思想也就是:根布局使用相对布局,然后在该布局中定义两个Fragment,然后使用scrollTo方法来实现侧滑的响应。下面就来实现下(RelativeLayout+Fragment+scrollTo):失败!主界面倒是可以侧滑,但是对于侧滑的界面就没有做到响应的响应;然后做了些调整,但是存在没有加载的问题。弃。然后,找到了这篇文章:安卓侧滑菜单DrawerLayout搞搞布

2020-09-07 15:13:25 38

原创 安卓的记事本应用开发日志(三)

如题:响应返回键。效果解决:在Activity中重写onKeyDown方法,当用户按下返回按键,在该方法中返回true的时候,程序退出;在该方法中返回false的时候,程序不退出。@Overridepublic boolean onKeyDown(int keyCode, KeyEvent event) { if(keyCode == KeyEvent.KEYCODE_BACK ){ boolean flag = checkboxListener.pressBack.

2020-09-06 15:30:08 35

原创 ImageView的OnClick方法中switch切换图片资源问题

问题:在ImageView的OnClick方法中,根据当前加载的图片资源,来进行切换图片资源。效果:点击图中的五角星,可以切换图片资源。涉及方法view.setTag(R.drawable.xxx);(Integer)view.getTag();view.setImageResource(R.drawable.xxx);示例viewHolder.startView.setTag(R.drawable.start_five); // 初始设置TagviewHolder.star.

2020-09-06 10:20:55 32

原创 安卓的记事本应用开发日志(二)

在上篇安卓的记事本应用开发日志(一)中简单Copy了一个页面,这里就简单实现下,先看效果:实现起来也比较简单,其中涉及到的图片按钮的点击效果、控件圆角、ListView去除分割线、ListView的Item设置距离这些内容,分别在博客中链接如下:android设置图片的点击效果Android控件圆角边框安卓ListView去除分割线、设置边距顺便一提,上面的图标均是阿里云图标截图,然后PS处理为白色的,需要图标的话可以访问:阿里云图标库。由于比较简单,这里就直接上传代码了。资源文件已上传c

2020-09-05 09:23:08 31

原创 安卓ListView去除分割线、设置边距

去掉分割线:android:divider="@null"<!--或者-->android:divider="#00000000" //设置分割线即之间距离颜色为透明加入到ListView的xml中即可。设置ListView的Item之间的距离:android:divider="#00000000" //设置分割线即之间距离颜色为透明,android:dividerHeight="10dp" //设置item之间的距离 如:<ListView .

2020-09-04 14:13:57 39

原创 Android控件圆角边框

效果:在Android中没有提供直接的圆角边框的属性,但是可以用shape来解决。即,border_radius_primary.xml中定义所需的圆角样式:<?xml version="1.0" encoding="utf-8"?><shape xmlns:android="http://schemas.android.com/apk/res/android" android:shape="rectangle"> <stroke an

2020-09-03 15:54:21 49

转载 android设置图片的点击效果

原始效果:点击后效果:图片的样式:<ImageButton android:id="@+id/serach" android:layout_width="40dp" android:layout_height="40dp" android:scaleType="fitCenter" android:layout_centerVertical="true" android:layout_toLeft

2020-09-03 15:36:08 119

原创 安卓的记事本应用开发日志(一)

首先是需求分析,这里简单的模拟一下:① 写笔记;② 笔记支持照片、视频;③ 笔记可以设置通知,提醒;④ 可删除笔记;⑤ 可上传笔记,做一个统计分析展示;⑥ 可以同步笔记;⑦ 可导出(详细和汇总HTML);⑧ 笔记有分类、标签;⑨ 应用的账户可以第三方登录;然后是界面草图设计,这里先百度看看别人的界面如何:感觉参考的对象应该差不多了,差不多可以做出来一个记事本的主页的草图了。...

2020-09-02 22:11:44 33

IM_TOPSIS.zip|IM_TOPSIS.zip

Influence Maximization Problem Use topsis and SIR Diffusion model.

2020-10-04

记事本_0.0.2.zip|记事本_0.0.2.zip

记事本开发过程记录,主要实现长按显现多选按钮效果,按返回按键判断是否显现Checkbox,是就设置CheckBox为gone,然后再退出程序。谨慎下载,没实现具体效果,仅仅是开发过程记录。

2020-09-06

安卓的记事本应用开发版本0.0.1|Test.zip

该资源对应博客《安卓的记事本应用开发日志(二)》的简单页面和ListView的加载。仅仅是作为开发日志的历史版本,非正式版本。谨慎下载!

2020-09-04

绘图库软件的介绍

很好的一个绘图库软件的介绍,喜欢的可以下载,共同学习编程

2015-05-07

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人 TA的粉丝

提示
确定要删除当前文章?
取消 删除