自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

小白兔de窝

心平气和,不起执念。

  • 博客(705)
  • 论坛 (6)
  • 收藏
  • 关注

原创 【论文写作】英文错误集锦

【语法错误】检查全文的et al—— et al 后面有个点。检查全文的as—— as后面是跟从句,不能只跟一个名词:as the sacrifice of most peaks(X)【搭配不当】形容solution space 一般用complicated而不是hard:the hard solution space(X)新的、讨巧的说法,不一定严密。先保证不出错,再斟酌词句。在deadline之前提前半周-一周把事情做完。...

2020-11-02 21:18:50 57

原创 【Matlab】Matlab入门笔记

从python转向matlab,记几个不一样的地方。数据类型整型有int8、int16、int32等;默认类型是双精度浮点型。Inf、-Inf表示正负无穷。NaN表示非数值。取整函数floor向下取整、ceil向上取整。round()向最近的数字取整,数字为0.5则取绝对值大的方向。加减乘除双精度浮点数参与运算时,返回值类型取决于其他参与数据类型。其他为逻辑、字符型,返回双精度;其它为整型,返回整型;其他为单精度,返回单精度。注意单精度浮点不能和整型进行算熟运算。关系运算

2020-10-30 21:40:49 91

原创 【论文写作】英文论文句子的流水记录

解决迁移问题:addressing the effects of migration in parallel evolutionary algorithms.排除简单并联:Finally, from a technological perspective, we also do not consider distributed optimization that makes use of geographically dispersed computers and allows using gri...

2020-10-12 23:29:39 78

原创 【收藏夹2020】

《千与千寻》背后暗藏的寓意你真的明白吗?在一个无国界( borderless)的时代,无立足之地的人是最受人鄙视的。立足之地就是过去,就是历史。 在我看来,没有历史的人和忘记了过去的民族,只能如蜉蝣一般消失,或者像一只鸡一样只知埋头生蛋,直到自己被吃掉。《 异境中的千寻——这部电影的主旨》—— 宫崎骏 1999年11月6日“曾经发生的事情不可能忘记,只是想不起来而已”,这是钱婆婆对千寻说的话。https://www.sohu.com/a/321946610_100205824...

2020-09-16 21:35:53 132

原创 【经验】知乎、科学网的经典帖子分享

【习惯养成】1. 如何才能解决拖延演讲视频《Inside the mind of a master procrastinator》用黑暗森林和及时行乐猴子描述拖延机制,已被翻译成中文:https://www.zhihu.com/question/26701102/answer/56136441...

2019-11-19 21:48:52 314

转载 【复杂网络】社团划分结果评估指标:Q、ARI、NMI

社团划分结果评估指标:Q、ARI、NMI一、模块度Q(Modularity)模块度也称模块化度量值,是目前常用的一种衡量网络社区结构强度的方法,最早由Mark NewMan提出了。模块度的定义为:模块度值的大小主要取决于网络中结点的社区分配C,即网络的社区划分情况,可以用来定量的衡量网络社区划分质量,其值越接近1,表示网络划分出的社区结构的强度越强,也就是划分质量越好。因此可以通过最大化模块度Q来获得最优的网络社区划分。Python:可以直接使用Community.modularity(

2020-11-29 12:12:55 26

原创 【Python】Python中的图的邻接矩阵转化为字典格式

networkx,adjacency_matrix()函数print(A) 是按节点对的形式显示,数据类型为<class 'scipy.sparse.csr.csr_matrix'>print(A.todense()) 按矩阵形式显示,数据类型为array现在需要将邻接矩阵转化为字典格式,用:nx.to_dict_of_dicts(G)输出:{0: {1: {'weight': 1}}, 1: {0: {'weight': 1}}}...

2020-11-10 12:15:49 61

转载 【Matlab】导入python生成的网络邻接矩阵

------------------在python中导出矩阵至matlab------------------------------一、通过文本文件如果矩阵是mxn维的。 那么可以用 :np.savetxt('dev_ivector.csv', dev_ivector, delimiter = ',')对应matlab读取为:dev_ivec = csvread('dev_ivector.csv') ###csv格式其实就内定了结构体如果矩阵是(n,)这种格式。['aa...

2020-11-10 11:49:31 68

转载 【MATLAB】 Graph Object(3): 展示关系网

老板:myc你还想不想转正了??myc:我只是去过五一长假了而已……老板:骗鬼呢?五一早就不放7天了好吗,App Designer都快写完了,你不想转正人家就要上位了myc:人家已经是老员工了……老板:再不写就开除myc:……myc这就把他呕心沥血的难产产物献给大家……我们在上一篇讲Graph的文章中生成了一个专栏462名关注者的关系图。然而有句古话说的好Code is cheap, show me the plot.好在MATLAB新的Graph类自带了plot的函数.

2020-11-10 10:55:04 45

转载 【Matlab】评估网络节点重要性

centrality衡量节点的重要性全页折叠语法C = centrality(G,type)C = centrality(___,Name,Value)说明示例C= centrality(G,type)为图中的每个节点计算由type指定的节点中心性。示例C= centrality(___,Name,Value)使用一个或多个名称-值对组参数指定的其他选项。例如,centrality(G,'closeness','Cost',c)指定遍历每条边的成本。...

2020-11-10 10:07:48 136

原创 【算法】可完整运行的ACO蚁群算法(Matlab)

可运行的蚁群代码:clearclcAnt = 300;%蚂蚁数量Times = 80;%移动次数Rou = 0.9;%荷尔蒙发挥系数P0 = 0.2;%转移概率Lower_1 = -1;%搜索范围Upper_1 = 1;Lower_2 = -1;Upper_2 = 1;% 以下为自定义X = zeros(Ant,2);Tau = ones(1,Ant);Tau_Best = zeros(1,Times);P = zeros(Times,Ant);for i=1:Ant

2020-11-02 16:57:53 71

原创 【鉴别】为什么维基百科比百度百科好用,谷歌学术比百度学术好用

(1)wiki百科会详细列出某个概念的来源、最早的文献及贡献者。相比之下,百度百科随机引用文献,对里程碑式的工作无引用。举例来说,在【wikipedia】搜索关键词"Genetic programming",得到如下结果:它介绍到,这个概念最早被John Holland提出、代表性著作是XXX,后续发展的大多数作者都是Holland的学生,以及它们又做了哪些贡献。简直就是一部详尽的学科方向发展史。以及让人看到前人的垦荒和后人继承的详细过程,对当下科学研究仍有启发。相比之下,【百度百科】.

2020-10-25 11:56:08 95

转载 【学习方法】有一个成绩很好的哥哥是什么体验?

Part 1 成为出题者我哥第一次认真的教我。不同于以前的敷衍,他帮我从书上画出重点,自己出题目给我做,他要求我反复的去做他画的重点题目,不停的做,反复的做,全神贯注的去体会,让大脑自己去熟悉这个解题过程,而不是单纯的去记忆解题方法,更不是记住答案,必须要用自己的思维去感受,去揣摩一步步解开这个逻辑命题的步骤,体会这种感觉,并牢牢记住这种感觉。然后以此为基础,自己想出在同样的条件下,出题者可能会以何种方式来考察你的逻辑推理步骤,这样一来,一道题就可以变幻出至少十道题,三道题的结合就可以变幻出五十道,正.

2020-10-19 13:33:54 106 2

原创 【科研】基于Aminer的各领域文献统计

【上升领域】特点:上升曲线,或者突然爆发的支柱,多以2020-2023结尾。fake news (up)deep learning (up)community detection (up)machine learning (up)graph neural network (up)【下沉领域】特点:连续三条柱体呈现下降趋势,多以2017-2020结尾。complex network (down)data mining (d...

2020-10-16 16:58:30 34

翻译 【学术】计算传播学:自然语言处理技术的应用情况和前景

社会传播学的研究方法可为实证和阐释两大类别:实证性方法假设事实真相是确定且唯一的,可通过量化分析或测试推导出因果关系。阐释性方法则立足于多重事实与真相的假设,侧重于研究语言、文本等交互信息自身的意义和价值。想象阐释性和实证性方法分别处于地球的两极,七大流派就填充于两极之间的空白地带,分别为:社会心理学派、控制论学派、修辞学派、符号学派、社会文化学派、批判学派、现象学派。排序越靠前的流派,越多地采用实证性研究方法,反之则表示阐释性研究方法在该理论中占上风。倾向实证性的学派与NLP的联系更加紧.

2020-10-09 22:06:49 106

原创 【数学】线性增长,指数增长,对数增长,幂增长

线性增长,斜率固定不变:y=ax+b y=ax+by=ax+b指数增长,曲率不断趋近于无穷大或0:y=ax+by=a^x+by=ax+b对数增长,曲率不断趋近于0:y=logax+by=log_ax+by=loga​x+b幂增长,曲率的绝对值不断趋近于无穷大或0,情况复杂:y=xay=x^ay=xa只从正坐标轴的角度看过去,幂函数和指数函数很像,但是指数函数的曲线更陡峭、开口较小,幂函数的曲线更平缓、开口相对较大。...

2020-09-15 11:03:00 346

原创 【Python】YAML版本导致的读取错误LoadWarning: calling yaml.load() without Loader=... is deprecated

原因是新版本yaml弃用了原版本的用法。解决:yaml.load(list, Loader=yaml.FullLoader)原理:

2020-09-05 20:37:57 230

原创 【科研故事】小王的故事(二)

小王没消停两天,又主动找我吃饭。我打趣道:怎么了?又和你导闹矛盾了?小王笑笑没说话,叫我去了食堂。我们边吃边东拉西扯地聊点有的没的。快吃完的时候,聊起交叉学科研究的问题。我提出一个观点:”交叉学科在做的时候,不能直接拿CS的皮毛去探那个领域的问题,这样做第一篇可以,但是后面的就不行。我记得某某年的时候,有人拿CS的网络去模拟一个视网膜疾病,发了很高级别的刊,但是后来再也没有人做过,因为CS部分的工作本身就很low。但是那人的data collection做得非常好,不论是数据量,还是特征误差,都控制

2020-08-28 15:13:45 127

原创 【科研故事】小王的故事(一)

博士生小王最近突发奇,想投稿个计算机的会议。摆在面前的首要问题是如何同导师沟通。小王作为学生,想的是:导师并不熟悉这部分工作,但是鉴于国内普遍的家长式管理思维,找人合作这个议题就很难开口。背着导师投稿又是学术大忌,约等于送人头。导师方面倒不一定看得上小王做的东西,只是知情之后就有担责的风险。小王选择让他知情,他就要负责任,署名不署名都很被动。小王如果不让他知情,小王就比较被动。作为一个纠结型小伙,小王纠结了两天,主动放弃了。其实在我看来,他这一篇大概率被拒稿的文章出师未捷身先死,也算死得其所

2020-08-27 15:42:26 143

原创 【报告笔记】大数据与人工智能的伦理挑战

今天分享大数据与人工智能的伦理挑战。(1)中立性算法表面中立,在学习中却可能形成隐形的歧视,甚至放大这些鸿沟。算法角度是合理的,但是社会往前发展,不能仅建立在数字化的优化上,而是要考虑很多人文的东西。例如高级职位推荐,女性占比8%-15%,系统开始偏向男性推荐,加剧性别差异。同理的还有秘书推荐给女性,卡车司机推荐给男性。随着系统对人购买力的打分,会有价格歧视。美国低矮桥,在设计的时候,就有把穷人挡在外面的意思。(2)时效性算法预测犯罪不犯罪。酒驾有些国家可以。燃放烟花爆竹是.

2020-08-22 12:12:57 272

原创 【学术】集百家之长,有一家之言

又到了一年一度的和其他博士交流的时间。通过对话,我总结了几点收获。以下都是以讲述者的视角来记录。两个关键词:identity、insight。identity指你在学术领域的成体系的、有标识度的研究成果。insight指对问题本质的理解和打破现有认知的角度。(1) identity不能太大。比如,具体到数学统计学中的张量研究,而不能说identity是机器学习,或者数据挖掘。这太宽泛了!也太累了!Z.ZH的identity就是机器学习。他基本上在机器学习领域的各个领域都立了碑。但是他很

2020-08-22 10:36:10 141

原创 【bash】快速切分数据文件

第一步:在Windows下安装git,通过开始菜单打开git bash第二步:切换路径。切换方式和cmd有区别,表现为以斜杠开头、作为分隔符,根目录后没有冒号。如: cd /d/第三步:使用split切分文件,可自动切分并命名。下面是按行切分:split -l 1000000 test.txttest.txt...

2020-08-20 21:56:17 94

原创 【Python】for循环中修改索引变量只对当前循环体有效

(1)歪打正着偶然在for循环中用了同一个计数变量,结果却歪打正着。原因是操作放在子计数变量之前。如下:>>> for i in range(20):... print(i)... for i in range(5):... i+=100...012345678910111213141516171819这是因为在python中,一个for循环在每次迭代开始时将list / iterable中的下一个元

2020-08-16 11:41:54 181

原创 【数据处理】UltraEdit处理超大文件的扩容方法

UltraEdit原始设置是限制51200大小的文件,有时候进行文件排序很容易超出限制,就会报出缓存错误,导致信息丢失。扩容步骤:高级-》配置-》设置-》临时文件-》上述的阈值-》多加一个0或者两个0...

2020-08-14 10:11:38 272

原创 【Python】数据处理神器 savetxt() 和 loadtxt()

还在为存取数据而烦恼吗? numpy帮你解决这个困扰。(1)用savetxt() 函数将数据存储到文件import numpy as npdata = np.ones((3,4))np.savetxt("./data.csv")文件保存成功:(2)用 loadtxt函数读取文件import numpy as npdata = np.loadtxt("./data.csv")print(data)数据读取成功:利器啊,利器!...

2020-07-31 23:27:55 390

原创 【Python】networkx关于网络分析的几个指标

(1)读取网络def load_graph(file_path): with open(file_path, "r") as fd: data = fd.readlines() # 分离出标题和数据行,如果没有标题,用#号注释掉下面这两行) title = data[0] data = data[1:] # 从数据中提取边,建立一个空的有向图G edges = [it.strip().strip(",").split(",")[:2] f

2020-07-31 14:07:46 816

原创 【数据处理】为什么CSV文件用WPS打开总是比原始文件少若干行

处理一个csv文件,每次用文本编辑器打开,是某行。换成WPS打开总少几百行。人工定位了一下异常的数据,锁定在这里:2020/07/03 00:43:24,SikorskyFlights,"Linsk Minyk“ Sikorsky2020/07/03 00:43:26,wendy_marchese,Wendy Marchese2020/07/03 00:43:26,Smartkr13564931,smart_Krish2020/07/03 00:43:26,ChiTsz1,ChiTsz1,

2020-07-30 18:23:07 317

原创 【Python】LDA使用LatentDirichletAll报错TypeError: __init__() got an unexpected keyword argument ‘n_topics‘

报错代码:LatentDirichletAllocation(batch_size=128, doc_topic_prior=None, evaluate_every=-1, learning_decay=0.7, learning_method='online', learning_offset=50.0, max_doc_update_iter=100, max_iter=50, mean_change_tol=0.00

2020-07-28 17:10:56 514

原创 【Windows】右键菜单“新建”选项没有word和excel

点击电脑开始菜单,点选“运行”;在弹出窗口输入“regedit”,点击确定;弹出注册表,在搜索栏检索“HKEY_CLASSES_ROOT”,点击展开;在下拉菜单中找到“.doc”;在“.doc”文件夹内右键新建“项”,命名为“ShellNew”;在“ShellNew”右键新建字符串,命名为“NullFile”。成功!亲测可行!...

2020-07-25 15:31:31 627 1

转载 【Python】unicode编码和bytes编码不能混用

报错:出现’ascii’ codec can’t decode byte 0xef in position 0:ordinal not in range(128)的错误。1、unicode和utf-8的区别。unicode指的是万国码,是一种“字码表”。而utf-8是这种字码表储存的编码方法。unicode不一定要由utf-8这种方式编成bytecode储存,也可以使用utf-16,utf-7等其他方式。目前大多都以utf-8的方式来变成bytecode。2、Python中字符串类型分..

2020-07-24 13:48:28 110

原创 【Tensorflow】anaconda3配置tensorflow各种报错的解决

1. 安装tensorflow报错tensorflow 2.X Failed to load the native TensorFlow runtime 问题解决https://blog.csdn.net/roamer314/article/details/106461717备注:安装Microsoft Visual C++ downloads即可解决报错。2.keras报错File "C:\Anaconda3\lib\site-packages\keras\utils\gener...

2020-07-23 19:23:48 351

原创 【Anaconda3】更新conda的方法

遇到一个报错:failed with initial frozen solve. Retrying with flexible solve.根据网上教程,先更新conda。在Anaconda prompt 输入conda update,提示:conda update --prefix C:\Anaconda3 anaconda按这条命令,更新conda环境。会更新非常多的包。更新完成后输入:conda update --all...

2020-07-23 16:34:34 550

原创 【Python】解决报错“No module named ‘pandas.core.indexes‘”

当我尝试用yaml打开一个存储pandas表格的数据文件的时候,错误发生了。报错信息如下:cannot find module 'pandas.core.indexes.base' (No module named 'pandas.core.indexes')原因:生成数据文件的环境和打开的环境不一致。例如,使用pandas 0.18.1 生成文件,使用pandas 0.17.1.打开。解决(二选一):pip install --upgrade pandasconda upg

2020-07-16 16:12:37 863

原创 【Python】安装包的时候提示缺少Microsoft Visual C++ 14.0的解决方案

最近安装一个python插件\python-Levenshtein-0.12.0,提示报错:error: Microsoft Visual C++ 14.0 is required. Get it with "Microsoft Visual C++ Build Tools": http://landinghub.visualstudio.com/visual-cpp-build-tools意思是系统里缺少Microsoft Visual C++ Build Tools。如果平时用vis.

2020-07-11 00:59:30 1282

原创 【Python】一个经常犯的时间统计错误

代码:import timeT0 = time.time()T1 = time.time()print("run time %s min" % (T1-T0)/60)报错:Traceback (most recent call last): File "predictNYC.py", line 249, in <module> print("run time %s min" % (T1-T0)/60)TypeError: unsupported operand...

2020-07-09 13:20:22 139

原创 【Notepad++】解决notepad打开大文件后卡住的问题

Notepad++打开大文件不佳,一般>400m就会卡死。换用UltraEdit打开。UltraEdit能够打开几个G的文件。其他用于大文件编辑的工具:用PilotEdit的快速模式,可以轻松打开70G的文件;SciTE我会乱说?我把楼上所有提到的能免费用的都用了一遍,结果还是电脑里面自带的SciTE给力了!Windows用UltraEdit即可,它专门支持大文件。基本原理就是把文件mmap到内存,没有touch到的部分不会从磁盘读到内存中来。EmEditor,付费软件,.

2020-06-23 20:02:02 2623

原创 【读书】听“樊登读书会”的要点和实践

樊登读书会早有耳闻,舍友买了会员天天听。在家无事下载了app,从免费图书开始。书中道理有可借鉴之处。卢森堡博士《非暴力沟通》你要分清楚,当前表达的是观点,还是情绪,还是事实。并不是只有"我觉得"才是在表达观点,很多时候人们以为的事实,其实都是在说观点。当我说“你怎么这么懒”,是在表达观点,而不是代表这个人真的懒。当我说“你怎么在沙发躺了一天”,才是在表达事实,而事实是不容易被否定的,对方也不会觉得被冒犯。Facebook首席运营官桑德伯格《向前一步》社会公平:(1)往前坐

2020-06-17 12:50:16 244

原创 【Python】把excel文件中的数据转化为字典格式存起来

【需求描述】例如下面表格为“值班表.xlsx”date name age 20200617 xiaowang 16 20200618 xiaozhang 18 现在需要把表格转化为字典存起来,方便读取。【步骤】(1)把“值班表.xlsx”另存为无格式的“值班表.csv”。默认是以逗号作为分隔符。(2)把第一列的日期作为关键字,构建空字典。例如,dic = {'20200617': {}, '20200618':{}}。(3)关键字对应的

2020-06-17 11:47:05 1727

原创 【记录】在家办公期间的菜谱

最近婆婆在家,做了很多好吃的给我。明天她要回去了,记录一下菜谱。 红烧猪蹄 买猪肘半只(28块/斤),剁成小块带回来,洗洗。 上【油锅】,放辣椒、桂皮、姜、蒜,放猪蹄进去炒。 接着放料酒、老抽,炒炒再放盐、生抽。 【高压锅】放水,放猪蹄,按蹄筋选项,压二十分钟出锅。 炸鱼 买鱼肉一块(10块/斤),让人切片带回来,洗洗。 上【油锅】,把鱼表皮炸焦脆。炸完倒出来。 上【油锅】,放辣椒、桂皮、姜、蒜

2020-06-13 20:17:02 230 2

原创 【收藏夹2019】

5本自然语言处理书单-附pdf:https://blog.csdn.net/xinshucredit/article/details/90516754几个常用的机器学习训练数据集(最全格式):https://blog.csdn.net/lihuoqingfly/article/details/90604435机器学习数据集哪里找:最佳数据集来源盘点:https://www.jianshu....

2020-06-12 16:46:41 1471

空空如也

求教python高手:一个简单的问题,lstrip函数切割错误

发表于 2015-08-08 最后回复 2020-04-16

python 如何定义动态二维数组

发表于 2015-08-17 最后回复 2020-01-13

python-matplotlib画图:如何将一个数以【指数形式】展现出来

发表于 2015-12-03 最后回复 2019-03-18

CSDN将我的一篇置顶博文搞丢了

发表于 2017-10-17 最后回复 2018-09-03

博客栏目中的类别名,希望允许冒号、竖杠、中文括号的存在

发表于 2017-12-13 最后回复 2017-12-13

vector定义二维数组之后,在子容器添加元素的方法——即扩充列元素。

发表于 2016-03-16 最后回复 2016-03-16

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人 TA的粉丝

提示
确定要删除当前文章?
取消 删除