- 博客(4)
- 收藏
- 关注
原创 Python Spider——爬取论文数据(二)
接上一篇,Python Spider——爬取论文数据(一)上一篇谈到了如何爬取某网的论文标题和论文作者,这一篇讲一下如何爬取多页,以及如何爬取作者的详细信息。
2021-03-27 19:17:57 12355 31
原创 Python Spider——爬取论文数据(一)
目的:爬取毕设所需的数据源,包括论文标题、论文作者以及作者的详细信息。所需第三方库:Requests库Selenium库BeautifulSoup库首先,我们打开知网首页:https://www.cnki.net/我们必须先输入关键词,再点击搜索按钮才能够得到我们想要的内容,在此我以知识图谱为例进行搜索。按下F12查看网页的源码:如上图,我们可以看到输入框所对应的input元素,将鼠标移到input标签上点击右键,选择Copy -> Copy selector 就可以拿到改标签的
2021-03-24 17:23:47 23200 9
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人