- 博客(5)
- 收藏
- 关注
原创 任务5:作者信息关联
任务5:作者信息关联 5.1 任务说明 学习主题:作者关联(数据建模任务),对论⽂文作者关系进行建模,统计最常出现的作者关系; 学习内容:构建作者关系图,挖掘作者关系; 学习成果:论文作者知识图谱、图关系挖掘。 5.2 数据处理理步骤 将作者列列表进行处理理,并完成统计。具体步骤如下: 将论文第一作者与其他作者(论文非第一作者)构建图; 使用图算法统计图中作者与其他作者的联系; 5.3 社交网络分析 图是复杂网络研究中的一个重要概念。Graph是用点和线来刻画离散事物集合中的每对事物间以某种方式相联
2021-01-24 14:15:31 174
原创 任务4:论文种类分类
任务4:论文种类分类 一、 小白的苦恼+2 1.还是一头雾水呀。 二、 实际操作 1.导入所需包 import seaborn as sns #用于画图 from bs4 import BeautifulSoup #用于爬取arxiv的数据 import re #用于正则表达式,匹配字符串的模式 import requests #用于网络连接,发送网络请求,使用域名获取对应信息 import json
2021-01-21 20:28:39 173 1
原创 任务3:论文文代码统计
任务3:论文文代码统计 一、 小白的苦恼 1.杨助教虽然视频讲解了Task1、Task2,一听就懂,一做就不会; 录播地址:https://tianchi.aliyun.com/course/video?liveId=41284 2. 有个学习Pandas的好网站: https://pandas.pydata.org/pandas-docs/stable/user_guide/10min.html。 二、 实际操作 1.导入所需包 import seaborn as sns #用于画图
2021-01-19 20:29:03 134
原创 Task2:论文作者统计
Task2:论文作者统计 一、 体残小白的吐槽 代码还是不能理解,比Task1的时候好,里面奥妙没有掌握; 一天学习的时间有限,前几天Task1的超时间的学习,导致了“突出”的复发,“南”, 虽然“南”,每天都有收获,唯有坚持。 二、 实际操作 1.导入所需包 import seaborn as sns #用于画图 from bs4 import BeautifulSoup #用于爬取arxiv的数据 import re #用于正则表达
2021-01-15 17:51:44 144 2
原创 Task1:论文数据统计(待续...)
Task1:论文数据统计(待续...) 一、 小白的吐槽 没有任何计算机专业基础,代码看不懂;(选择先不理解) 没有Python专业,分不清楚Anaconda和pandas;(队友解释很给力) 安装连接:https://blog.csdn.net/weixin_37766087/article/details/100742198 视频教程: 英语基础差,太坑自己了; 资料下载,官网的下载速度很慢。(清华大学开源软件镜像站给力) https://mirrors.tuna.tsinghua.edu.cn/a
2021-01-13 23:20:12 252
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人