- 博客(1)
- 资源 (1)
- 收藏
- 关注
原创 Selenium + phantomJS 爬取动态网站
受同学委托,帮忙爬新浪微博的微博和评论内容。发现这是一个动态网站,我前端技术不行,搞不懂它的ajax接口,所以不能直接用requests包爬了。后来了解到Selenium可以模拟浏览器(Firefox, phantomJS等)的点击,然后用Beautifulsoup解析HTML,Selenium是爬动态网站的神器!phantomJS是一个没有界面的浏览器,用来爬虫最合适了。把Selenium用到的一
2017-07-13 19:59:46 1200
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人