自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1)
  • 收藏
  • 关注

原创 python网络爬虫:用selenium+BeautifulSoup库实现百度热搜榜数据的爬取

上图就是百度实时热点的界面,本次的任务就是爬取到排行榜上的前50排名的关键词以及它的搜索指数。用到的库:1、selenium              2、BeautifulSoup              3、xlwt(一):分析:爬取一个网页的首要工作是分析网页的源代码:可以看到tr标签里面就有我们想要的东西,排名,关键词,搜索指数tr标签里面的三个class属性为:first,keywor...

2018-06-24 12:42:31 5070 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除