- 博客(1)
- 收藏
- 关注
原创 python网络爬虫:用selenium+BeautifulSoup库实现百度热搜榜数据的爬取
上图就是百度实时热点的界面,本次的任务就是爬取到排行榜上的前50排名的关键词以及它的搜索指数。用到的库:1、selenium 2、BeautifulSoup 3、xlwt(一):分析:爬取一个网页的首要工作是分析网页的源代码:可以看到tr标签里面就有我们想要的东西,排名,关键词,搜索指数tr标签里面的三个class属性为:first,keywor...
2018-06-24 12:42:31 5077 2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人