gephi生成网络关系图_“知识结构”初探|学术全领域47310张星云图可视呈现与结构分析...

指导老师 | 傅洛伊 王新兵

核心成员 | 李琦

https://dev.acemap.info/map/paperMap/0?type=seminal_paper_map

b3822a7953bb1285a48328d6088d25c5.png

导读

长期以来,人类的知识包含在形形色色的出版物中,并得以传播。而出版物之间相互关联的方式之一就是通过彼此之间的引用关系。我们称这些关系所形成的结构为“知识结构”。纵观万物,事物之间总能够通过结构产生关联。在我们的身体中,每经过一年时间,身体98%的细胞会重新更新一次,从哲学意义上来说,我们不应该是从前那个我们。然而,在别人看来我们之所以没有发生变化,是因为我们体内的细胞之间的连接结构并不会随着细胞的更新而变化,所以结构当中蕴含着每个个体区别于其他个体的丰富、而又专有的特质。而在当今数据爆炸的时代,通过结构对知识进行挖掘,必定能够对知识的诞生,演化,甚至消亡的特性进行解密。传统的基于引用量的学术实体度量指标比如H-index,SCI等均未将文献的知识结构加以考虑,这些指标远远不能解决上述问题。因此,知识结构中所蕴含的信息并没有被广泛的挖掘。

基于此,Acemap团队完成了全领域47310张星云图的可视化,通过星云图展现了知识结构在引斥力约束下的具体表现形式。其涵盖了历史,计算机科学,环境科学,心理学,数学,物理学等16个学科下的294个领域。除此之外,提出了全新的海量大图可视呈现方法——“图间跳转”。最后,尝试使用可视分析的方法对星云图呈现的知识结构进行初步分析。

物理规律下的星云图——知识结构的星系化呈现

古人在《易经》中将万事万物的运行规律归结到阴阳的相互作用,现代物理认为原子是组成物质的基本单位。无论是《易经》还是物理学,都用自己的方式描述着这个世界,并且揭示了一个深刻的哲理,即世界上万物运行的规律存在相通性,不同事物的演化往往具有类似的过程。在宇宙中,大到宇宙天体,小到我们个体都要经历诞生,发展,以及消亡的过程,学术领域下某一研究主题的发展也是如此。万有引力将宇宙从混沌塑造为有序,形成了各式各样的星系结构,这启发我们使用类似方式去揭示知识结构的内在特质。

力引导算法能够根据知识结构中的引用关系,使用引斥力完成知识结构在二维平面上的刻画。随着算法逐渐收敛,节点在空间上的分布从混沌逐渐走向有序,而节点在空间上的有序分布将有助于我们了解知识结构的特质

学术领域的发展当中,在某一特定的研究主题中会存在一个或多个高影响力的论文,通常这些论文是这个研究主题的开创者或者集大成者。因此,往往会有很高的引用量。高引论文以及引用这篇文章的其他文献通过彼此之间的引用关系形成了一个引文网络。我们将使用力引导使其网络结构,网络内的聚类情况展现在二维平面上,最终得到的可视化结果就是星云图。在每个星云图中,节点的大小与节点在图内的度相关,中心的红色节点代表研究主题的引领文章,除了蓝色的其他相同颜色的文章代表这些文章有相似的研究主题,蓝色代表这些文章不属于任何子主题或者这些文章在网络中的度很小。

海量大规模星云图可视呈现如何实现?

在Acemap数据库中,我们选取了其中引用量大于1000的47310篇文章,对其引领的星云图进行可视化。如果不考虑不同星云图中节点的重复,并按照星云图最少节点数1000对数据量进行估算,其数据量也已经达到了4000万以上。除此之外,在所有这些高引论文中,最高的单篇引用量甚至达到了29万。因此,对海量大图进行可视化显然不是一件容易的事。除此之外,尽管Gephi在网络可视化中被广泛使用,其GUI工具只能实现人工对单个网络进行可视化,且操作较为繁琐,其较低的效率显然不能满足大数据的场景。

首先,我们设计了统一的节点颜色与尺寸计算方法,使得程序能够帮助我们完成节点属性设置。然后,使用gephi的开发者提供的可供java调用的工具包,我们将布局工具重新封装,使其能够适用于并行运算的场景,从而使得布局效率极大提升。至此,我们完成了海量星云图的生成。

然而,如何将海量的图数据进行存储,并在需要时快速调用成为摆在我们面前需要解决的一个问题。我们将星云图的可视化结构按照统一的格式存储在MySQL中,并设计合适的索引,使得我们在需要时可以快速抽取特定星云图的全部信息。

由表及里——“图间跳转”的可视呈现方式带你深入感知知识结构

d10f4204ad6f7c4bd5ae0a456f0b3b46.png

图 1 计算机领域星云图

当完成海量星云图的生成与存储后,我们设计了一种“图间跳转的星云图可视呈现方式。以计算机领域为例,我们将该领域内所有引用量大于1000的论文以及他们之间的引用关系可视化在一张星云图内,以作为进入这些文章引领的星云图导航起始页。在这张地图中我们可以发现整个计算机领域内部形成了非常明显的板块结构。图中聚集在同一个社区内的论文代表其具有相似的研究兴趣,图中节点颜色越接近红色,表明该研究方向越火热。最明显的就是深度学习方向,在其板块颜色基本为红色,这与近年来人工智能的爆炸式增长是分不开的。除此之外,其中较为明显的社区结构有机器学习,无线网络,信息安全,软件工程等。

我们可以通过点击图中任何一个节点在左上角卡片的related map选项中找到该节点引领的或者包含该节点的地图。值得说明的是,related map中的地图不只包含前面提到的星云图,还可能包含相关的脉络树或者领域地图等,并且当进入地图的实体页面之后同样可以通过related map继续跳转到其他相关地图,其具体使用如下图所示:

8ec505c7a48f9111dc84a037fdabe20c.gif

图 2 related map呈现方式演示

除此之外,我们同样可以在Acemap的论文实体页面上完成向该论文引领的地图的跳转。

23e13a9aa657b26f567b4a16c0c6d14d.gif

图3 paper页面向地图的跳转

结构初探——学术星云图知识结构类型及其成因归纳

a020579b8310423af3e37a7c713a2c6f.png

图 4 几个典型的星云图

在对大量的星云图进行观察与总结后,我们可以将星云图大致分为三类。

普度众生型:在这一类中,正如上图中A图所示,这些星云图往往会有在引领文章附近存在一个完整的蓝色圆环,我们发现这些文章往往是学术专著或者是文献综述。这类的文献更趋向于总结某个领域中各种解决问题的方法而少有提出解决某些问题的新方法。除此之外,这些文章总是包含更广泛的子主题,并且即使有高影响力的文章引用这个文献,思想的传承却很难持续,从而导致此类星云图的知识结构相对简单

孕育新星型:在这一类中,正如上图中B,C,D,E所示,前面提到的蓝色圆环已经不复存在,取而代之的是蓝色的岛状或者月牙状区域,蓝色圆环的消失表明网络内部文章相关程度的提高。除此之外,在这些图中出现了至少一个具有非凡影响力的文章,从而使得星云图的知识结构形成了更加复杂的社区结构。我们发现,与第一类引领文章不同的是,这些文章更加趋向于解决某一领域下的特定问题,或者创新性的提出新的方法,从而更具启发性。而且新出现的学术新星完成了对原始文章思想的继承,从而在某种意义上加深了领域的火热程度

新星超越型:在最后一类中,如上图F所示,我们发现,在这一类的星云图中,同样诞生了高影响力的学术新星,与前面不同的是,这些文章的引用量远远超过了引领文章,这说明这个研究主题内的引领性文章已经发生改变,研究主题中新的领导者已经出现

未完待续——知识脉络与知识熵深入探究知识结构

星云图不能解释知识结构的成因,更无法揭示知识结构的演进特性,只能简略的刻画整个研究主题的全貌,我们想要更加深入地挖掘知识结构中所蕴含的规律,就必须借助理论分析或者其他更加直观的方法。除此之外,我们能够直观地感觉到具有相近引用量的论文的影响力不一定相同,并且其形成的星云图知识结构越复杂,其启发性应该越强。因此,基于知识结构,我们能否提出一种更加直观地度量文献影响力的指标?我们将推出基于知识脉络与知识熵的知识挖掘与度量方法及其可视呈现平台,用于解密知识结构中蕴含的奥秘,敬请期待……

点击文末阅读全文可浏览47310张星云图噢!

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
提供的源码资源涵盖了安卓应用、小程序、Python应用和Java应用等多个领域,每个领域都包含了丰富的实例和项目。这些源码都是基于各自平台的最新技术和标准编写,确保了在对应环境下能够无缝运行。同时,源码中配备了详细的注释和文档,帮助用户快速理解代码结构和实现逻辑。 适用人群: 这些源码资源特别适合大学生群体。无论你是计算机相关专业的学生,还是对其他领域编程感兴趣的学生,这些资源都能为你提供宝贵的学习和实践机会。通过学习和运行这些源码,你可以掌握各平台开发的基础知识,提升编程能力和项目实战经验。 使用场景及目标: 在学习阶段,你可以利用这些源码资源进行课程实践、课外项目或毕业设计。通过分析和运行源码,你将深入了解各平台开发的技术细节和最佳实践,逐步培养起自己的项目开发和问题解决能力。此外,在求职或创业过程中,具备跨平台开发能力的大学生将更具竞争力。 其他说明: 为了确保源码资源的可运行性和易用性,特别注意了以下几点:首先,每份源码都提供了详细的运行环境和依赖说明,确保用户能够轻松搭建起开发环境;其次,源码中的注释和文档都非常完善,方便用户快速上手和理解代码;最后,我会定期更新这些源码资源,以适应各平台技术的最新发展和市场需求。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值