学术论文信息提取

该博客主要介绍如何从PDF格式的学术论文中提取元数据,包括标题、作者、关键词和最后修改日期。要求提取的日期格式为特定样式,并提示通过打印所有信息来查找对应属性的英文名。
摘要由CSDN通过智能技术生成

现有一篇PDF格式的学术论文step3/ICSE2014.pdf

右侧编辑器中有一个函数Read,它有一个参数path,代表这个PDF的路径,或者是另一个类似的PDF文件的路径,它们的区别仅在于元数据上。

请在这个函数中读取指定论文元数据中的标题、作者、关键字、最后一次修改日期四个属性,并将其按照(<编号>)<属性名> : <属性值>的格式输出。

要求:

  • <编号>是按输出顺序编号为1-4

  • <属性名>要求使用上面的汉字。

  • 最后一次修改日期的属性值要求按照XXXX年XX月XX日的格式输出(需要分析原始数据中哪一部分是年、月、日)。

提示:如果不知道这几个属性对应的英文名是什么,可以先打印出所有信息看一看。

测试数据由评测系统读取并传递给Read函数,期间产生的输出将会与规定的输出进行比较,详细要求请见测试说明

测试说明

如果输入的是:
step3/ICSE2014.pdf
那么应该得到的是:
(1)标题 : The Strength of Random Search on Automated Program Repair
(2)作者 : Yu

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值