2021美赛学习总结
包括了gephi软件使用,数据分析软件Mpai使用,美赛资料分享
文章目录
1.Gephi
1.1 Gephi是什么
Gephi是一款开源免费跨平台基于JVM的复杂网络分析软件,,其主要用于各种网络和复杂系统,动态和分层图的交互可视化与探测开源工具
简单来说,就是可以通过这个软件进行数据可视化,画出知识图谱、数据网络,可供相关技术人员学习和分析
1.2 Gephi下载及安装
可以参考中科院的课程讲座,包括了Gephi的应用、软件的安装、功能及操作、可视化、指标计算以及软件相关的资源介绍等内容
视频中的老师给出了详细的安装步骤,跟着视频就行了,当然后续的学习也可以参照老师,但我个人认为老师讲的不够清晰清楚,她把软件各个区间的内容都讲得十分清楚,例子也给了一个,只能当作了解性学习,针对具体问题还是得具体操作更有助于学习了解
1.3 Gephi具体使用
这里我以2021美赛D题的第一问艺术家影响力为例,构建了影响力网络
(1)数据导入
利用Excel构建点表格,表格建议保存为node.csv的格式才方便导入到gephi中,id为图谱点的编号,label为图谱点的名字,每个点对应一个编号,在后面的边表格中也需要一一对应
利用Excel构建边表格,同样保存为edge.csv的文件格式,source为连出点的id,target为连入点的id,后面的type、id等可写可不写,当需要时可以加上,要注意的是这里的id需要对应点表格中的id
然后开始导入数据,首先输入节点表格
接着,我们导入边表格,要注意的是在同一工作区内进行导入
(2)图形概览
然后运行下列选项,具体用处可以参考官方文章
紧接着,我们可以开始自定义点和边的颜色大小等参数了,我这里给出一个示例
最后选择一种图样,运行之后就会出现网络了
然后还可以调整边的大小、颜色,显示标签等等内容
(3)图形预览导出
最后在预览区,还可以对你的图形进行更完善的调整,使你的图形更加好看
2.MPai数据科学平台
2.1 MPai是什么
MPai数据科学平台也是我们这次美赛发现的一个超级好用的软件,提供了一个很好的平台给我们进行数据分析,里面具备了大量的算法和模型,你只需要将数据导入到平台上,然后选择对应的算法或者模型,它给出相应的分析。同样可以到官网进行了解
2.1 MPai具体使用
这里同样以2021美赛D题的数据为例,进行分析处理
下载安装完成,登录之后,创建工程,然后就是导入准备好的数据
导入成功后,右键打开
接着,就可以选择想要应用的算法或者模型,这里我选择了LightGBM分类
调好相应的参数之后,点击分析就行了,然后查看分析结果,也可以得到各种分析性数据
3.补充
3.1相似度
在考虑音乐相似性的时候,我们用到了相似性度量,可以参考网上或者论文的相似性度量文章
3.2分享
因为准备美赛数模,我提前收集了很多算法模型的资料学习,还有对应的论文之类的文件,如果需要的话可以私信我,网盘分享给大家