acm数据处理|加入数据库（django）

最新推荐文章于 2024-07-06 13:51:47 发布

acm永远的神

最新推荐文章于 2024-07-06 13:51:47 发布

阅读量96

点赞数

文章标签：数据库 django sqlite 算法数据结构

本文链接：https://blog.csdn.net/acmyyds/article/details/131835480

版权

acm数据处理

1.将articles.txt文件的【SUCC】去掉，只保留论文的id

在这里插入图片描述

1
2
3
4
5
6

with open('./articles.txt', 'r',encoding='utf-8') as f:
for line in f.readlines():
line=line.strip('[SUCC]')
with open('./articles2.txt', 'a',encoding='utf-8') as ff:
ff.write(line.strip()) # 把末尾的'\n'删掉
ff.write("\n")

在这里插入图片描述

2.inlink.txt 里面的形式原本是被引用论文id 引用论文id：

在这里插入图片描述

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18

//这个效率慢，不好！
with open('./articles.txt', 'r', encoding='utf-8') as a:
for id in a.readlines():
print(id.strip())
with open('./inlinks.txt', 'r', encoding='utf-8') as f:
with open('./inlinks2.txt', 'a', encoding='utf-8') as ff:
for line in f.readlines():
line = line.strip()
line = line.split()
# print(line[1])
if(id.strip() == line[1]):
ff.write(line[0])
ff.write(" ")
ff.write("\n")

# with open('./articles2.txt', 'a',encoding='utf-8') as ff:
# ff.write(line.strip()) # 把末尾的'\n'删掉
# ff.write("\n")

现在处理过后表示为每一行代表一篇论文引用的其他论文id，如下图所示（没有的则是一个空行）

在这里插入图片描述

3.处理outlinks.txt 同理inlinks.txt：

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17

最低0.47元/天解锁文章

acm永远的神

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
acm数据处理|加入数据库（django）

ff.write(line.strip()) # 把末尾的'\n'删掉。# ff.write(line.strip()) # 把末尾的'\n'删掉。# ff.write(line.strip()) # 把末尾的'\n'删掉。ff.write(line.strip()) # 把末尾的'\n'删掉。affiliations= models.TextField('作者单位')affiliations= models.TextField('作者单位')创建如下几个表的字段。
复制链接

扫一扫