手动反爬虫,禁止转载: 原博地址 https://blog.csdn.net/lys_828/article/details/122174817(CSDN博主:Be_melting)
知识梳理不易,请尊重劳动成果,文章仅发布在CSDN网站上,在其他网站看到该博文均属于未经作者授权的恶意爬取信息
1背景需求
在进行文献整理时候,往往需要下载导出bib数据文件,但是这类数据想要进一步保存和拿来做数据分析,就需要将bib文件转化为python中常用的数据结构了,bib文件中的数据结构如下。
2 前提准备
需要使用到一些四个模块bibtexparser、pandas、os和sqlalchemy模块。其中除了os模块是python自带的模块外,其它的三个模块均需要在命令行中进行安装。一次性安装指令如下,模块之间只用空格分隔。
<