CSSCI数据采集,转化为python中的DataFrame格式,并存放到MySQL数据库
手动反爬虫: 原博地址 https://blog.csdn.net/lys_828/article/details/123665894
知识梳理不易,请尊重劳动成果,文章仅发布在CSDN网站上,在其他网站看到该博文均属于未经作者授权的恶意爬取信息
1 CSSCI数据采集
CSSCI中文社会科学引文索引数据库是由南京大学出版的,对我国中文社会科学期刊(包括辑刊)文献进行整理和索引的数据库 。该数据库为收费数据库,只有订阅的单位或者机构才有权限访问该数据库。订阅用户可以在IP范围内直接访问。也可以通过单位的VPN在单位IP范围之外进行访问。以下详细介绍数据库中文献数据的下载过程。
(1)打开CSSCI数据库官方网址界面。
(2)设置检索条件。在CSSCI的首页,点击“高级检索”,进入高级检索的页面。在高级检索页面中,将“每页显示”设置为50&#x