python+urllib+selenium爬取CSDN单个博主的所有博文
爬虫、CSDN
前置准备:
修改代码中的url、url2成你想爬取的博主的相应域名,只需要改qq_32465127的部分。
在py文件的同目录下放一个火狐浏览器驱动geckodriver.exe
步骤:
1.通过selenium获取js动态加载的页数
页数是javascript动态加载,不能直接通过urllib获取。改为通过selenium获取页数。
2.通过urllib...
原创
2019-02-07 19:19:01 ·
610 阅读 ·
0 评论