Faya美数课
文章平均质量分 63
人生苦短我愛Python
鉴定为:春春的飞舞
展开
-
# Voronoi × Tableau
写在前面贴一个自己很喜欢用的图,之前在笔记本里有过记录,现在在CSDN里记录一下方便自己以后查阅,在毕设里浅尝一下叭~正餐开始数据准备首先是数据集,整理成Excel格式:接着将Excel另存为.csv格式,需要注意的是,如果数据中有中文,则需要另存为CSV UTF-8,避免出现乱码:Voronoi Diagram(维诺图)制作网站其次,打开网址,进入国外大神创建的工具页面,上传CSV数据文件调整好后点选下载即可,在这里由于我需要进行对比分析,选用的是三角形上述下载的图形无后缀,需原创 2022-04-10 13:03:56 · 420 阅读 · 0 评论 -
# 研究杂感 × Gephi探秘飞升(第三辑)
写在前面现在是2022年03月26日,周六晚20:35前段时间准备将ROST CM6 绘制的图像转用 Gephi 软件来进行替代也学习了一些前人的经验,但据我个人总结,Gephi具有以下2个硬伤:1、绘制的线条过多过乱2、无法直接选择节点大小当然在之前也给出了一些解决方法,如通过筛选控制线条数目,采用导入文件的形式控制节点 Size 等,但我个人觉得依然不是一个很好的方法。于是我就尝试了一下 Gephi 第一辑中我脑海中一闪而过的念头,事实证明,这确实或者说应该是对于大量无规则语义内容最为原创 2022-03-26 21:55:56 · 1410 阅读 · 0 评论 -
# 研究杂感 × 改进文本共现分析 PMI-Gephi(第二辑)
写在前面理论介绍其中,分子是两个词语共同出现的概率,分母是两个词语分别出现的概率的乘积在数学中,我们认为,理论上分子等于分母:分子中的P(W1,W2) ,它指的是这两个词语在语料中的实际贡献概率分母中的P(W1) 和 P(W2) ,它指的是两个词语实际出现的概率从理论上推导这两个词语共同出现的概率,也就是说分母相当于一个期望值,分子是一个实际出现的概率,如果说实际贡献的概率比上期出现的...原创 2022-03-26 20:17:52 · 734 阅读 · 1 评论 -
# 研究杂感 × Gephi(第一辑)
写在前面之前用过ROST CM6 来进行毕设中有关景区整体的感知,但是ROST CM6似乎已经是2010年的产品了,用在2022年毕设有点稍旧(当然Gephi似乎是2009年的产品 )不管怎么说,Gephi不管是从名字上还是内容上似乎好像也许可能比 ROST CM6 高端辣么一点点,现在学习一下绘制过程和方法,将毕设部分进行调整和改进。正餐开始其实利用Gephi来进行相关分析和LDA差不多LDA所做的内容主题是割裂的,无法得知各主题间的相关关系,丢失了词语和句子之间的联系,常常导致我们无法给主题进行原创 2022-03-26 20:45:54 · 1517 阅读 · 0 评论 -
# 研究杂感 × Citespace(第三辑)
写在前面Citespace的基本操作在前述两辑已经有过介绍,这一辑主要是探讨一下内容解读以及可视化优化。聚类分区前提是要点选(find clusters)点击紫葡萄前的这个即可完成聚类颜色分区该分区形状为十字架(那是相当的难看)尝试了一下似乎也不能变更为圆形,那就将其节点大小调整至最小(而且似乎多点几次K会将其距离拉开(这个比较玄学,还没太搞懂是否真的有效 ))但是确实相较上面那个形状是确实是更分散了…这种类型的图像似乎更适合直线段来连接,点选这个按钮将线段变直同时,针对这些白色的原创 2022-03-11 17:28:56 · 553 阅读 · 0 评论 -
# 研究杂感 × Citespace(第二辑)
写在前面Citespace 做时区图、关键词突现还挺不错的,其他的真不行~第一辑做了关于CNKI的,这一辑试试看WOS准备工作首先进行WOS数据导出,还是得是 download 来进行命名,记录内容为全记录与引用的参考文献就可:选择 WOS ,其他操作和CNKI导入是一样的,最后RUN一下remove duplicate即可:然后新建项目,保存即可相较于CNKI,WOS框内内容均可以做分析,褐色部分是其特色部分:然后依然是老套路:另:突然发现 WOS 一次只能导出500条信息,原创 2022-03-11 15:28:06 · 248 阅读 · 0 评论 -
# 研究杂感 × Citespace(第一辑)
Citespce 数据可视化写在前面Citespace 软件在揭示学科的动态发展规律,发现学科的研究前沿上有一定的优势;而对学科主题之间的关系进行清晰的呈现、或者数据量非常大的时候,可以选取 VOSviewer 软件绘制知识图谱。刚学完VOS的文献计量,确实颜色和聚类呈图比Citespace优秀很多,但是做时间的共现分析确实Citespace要略胜一筹,下面就好好研究下Citespace用法。正餐开始点击 StartCiteSpace_Windows 进入下述界面:输入2(代表使用中文进入软件环原创 2022-03-11 13:16:00 · 4758 阅读 · 0 评论 -
# 研究杂感 × VOSviewer(第六辑)
VOSviewer 数据可视化 ⑥——图片保存与修改标签字体option会有一个百分比选项,当百分比越大的时候,所保存的图片会越清晰设置好后,进行图片保存(.PNG)VOS自带的字体非常少,所以若是想要设置某种字体需要先将图片进行导出,然后导入到其他软件中进行修改。采用这种手段需要将图片保存为PDF格式,然后再导入到AI里面进行调整等,在这里就不细说了,感觉基本用不上。总结至此VOSviewer的相关研究就到这里结束了,收获满满呢!浅尝一下⑧~...原创 2022-03-10 10:46:51 · 3338 阅读 · 0 评论 -
# 研究杂感 × VOSviewer(第五辑)
VOSviewer 数据可视化 ⑤—— 中国知网CNKI共现~首先勾选CNKI所需文章,然后进行自定义导出需要把导出的文件另存为CNKI导出的文件后缀是 .xls ,需要修改后缀为 .xlsx VOS才能读入。接着用之前的代码来解决CNKI,会生成一个.net 文件按前述进行运行,可得如下图像(记得把最大的检索词去掉):这里很多节点都是灰色的,出现这个问题并不代表他们都同属一个 cluster,而是如左侧所示聚类多达82个。没有如此多的颜色来对图像进行表达,所以就都使用了灰色(题外话原创 2022-03-10 10:17:15 · 428 阅读 · 0 评论 -
# 研究杂感 × VOSviewer(第四辑)
VOSviewer 数据可视化 ④—— 使用同义词词典合并同义首先绘制一个关键词网络图然后我们尝试将 impact 和 impacts 进行合并,将 efficiency 和 economic growth进行删除。所采用的方法是修改(或者说是导入)VOS里的 thesaurus_terms.txt 文件首先将原有的 thesaurus_terms.txt 文件复制到自己想要导入的路径下然后针对 thesaurus_terms.txt 文件内容进行修改共分为2列,中间用 tab 符号原创 2022-03-10 09:19:05 · 1140 阅读 · 0 评论 -
# 研究杂感 × VOSviewer(第三辑)
VOSviewer 数据可视化 ③—— 手动修改节点标签文字本期主要讲的是如何手动修改节点标签,例如国家如何设置首字母大写,Ppeoples R China如何修改为China。在进入WOS导入数据时又发现个小Tip,可以双击两下 “添加到标记结果” 选项,而后可以直接输入自己想要的条目数,非常方便正餐开始要想解决上述问题,首先要将VOS文件进行保存成CSV格式(1个node文件1个edge文件,均为csv格式)。导出之后我们来进行数据的手动修正:首先打开node文件新建1列 lab原创 2022-03-09 12:43:48 · 3367 阅读 · 3 评论 -
# 研究杂感 × VOSviewer(第二辑)
VOSviewer 数据可视化 ②—— Web of Science共线分析首先利用WOS导出文献按理说应该对所选的文献进行一个筛选,首先是时间方面根据自己的研究情况来看,这里我采用的是出版年份所有时间的数据;同时对所检索的数据库也可以做个限定(比如在全部数据库中进行检索),但比如机构、国家这些信息,有的数据库中不会进行显示,而WOS的核心合集中数据就非常齐全,所以以后应该默认也是在WOS核心数据集中进行文献计量分析。选择文献后,点击标记结果列表,可对所标记的文献进行初步筛选下一步将标记结果原创 2022-03-08 18:47:07 · 2368 阅读 · 1 评论 -
# 研究杂感 × VOSviewer(第一辑)
VOSviewer 数据可视化 ①—— 英文论文摘要绘制可视化网络写在前面很小就喜欢画画,对各种漂亮的东西完全没有吸引力,数据可视化完完全全就是我的菜(当然技术很差只能跪着看别人的 )之前大三痴迷 Tableau 了一段时间(然后3分钟热度就结束了 ),现在又打算入坑VOSviewer,希望能够好好走完…...原创 2022-03-08 15:31:01 · 2530 阅读 · 0 评论