人生苦短,我XXXX
其实我也是突发奇想,起因是毕设的参考文献都是英文,学校的指导规范要求参考文献必须以第一作者的首字母排序。e.g.
[1] Alice ...
[2] Bob ...
[3] Charlie ...
Copyright © https://blog.csdn.net/s_gy_zetrov. All Rights Reserved
然而下里巴人的我,当时并没有想到用 Endnote(甚至还是保研北大的生信大佬后来提醒我我才知道的 ,因为我当时只是知道有个叫 Endnote 的东西,但根本不知道怎么用)。
那么怎么才能把四十多条参考文献按照首字母排序呢?一条条拿眼睛对?这绝对不符合我的风格,为什么呢,前几天,我还发了个朋友圈,在这里转载一下:
毕设要求的文献格式很迷,目测是 GB/T 7714,然而我所有的文献都是之前按 之前投 BMC 时魔改的。
如果一个一个复制文献标题去百度学术搜然后再手动导出符合要求的文献格式显然不符合我的风格,
更别提正文中的引用也要相应由我之前的“[xxx]”改为学校要求的“(xxx et al. 2016)”。
Copyright © https://blog.csdn.net/s_gy_zetrov. All Rights Reserved
所以直接开元素审查,基本摸清了百度学术的页面结构。
然后开 postman 稍微测试了下,摸清了内部 API。
反正最后 beautifulsoup 加上写了几个正则,把 request URL一拼接,得到的大致效果就是输入论文标题
文件如图1,爬虫输出如图2的符合标准的带编号的文献格式(第一行)
以及能在正文中直接使用的引用格式(第二行