python
WindSearcher
打造自己的梦想,否则就被雇佣打造他人的梦想!
展开
-
requests抓取二进制数据
想必大家思考过,我如果把网上的图片,视频爬下来,那我怎么保存在本地呢?因为图片,视频本身是二进制流。所以,想要抓取它们,就要拿到它们的二进制码。以GitHub的站点图标为例。from bs4 import BeautifulSoupimport requests, sysimport lxmlresponse = requests.get('https://github.com/...原创 2020-01-06 21:49:10 · 2506 阅读 · 0 评论 -
爬取当当网 Top 500 本五星好评书籍
打开这个书籍排行榜的地址http://bang.dangdang.com/books/fivestars/01.00.00.00.00.00-recent30-0-0-1-1可以看到一下网页每一页显示 20 本书当我们点击下一页的时候你可以发现地址变了http://bang.dangdang.com/books/fivestars/01.00.00.00.00.0...转载 2019-08-23 22:33:55 · 983 阅读 · 0 评论 -
爬取豆瓣最受欢迎的250部电影慢慢看
接下来咱们就来爬取豆瓣上评分最高的250部电影这次我们就要来使用上次说的BeautifulSoup+Reuqests进行爬取啦这次我们将爬取到的内容存放到 excel 吧首先打开我们的目标链接https://movie.douban.com/top250可以看到这样一个网页每一页显示了 25 条数据当我们点击下一页的时候链接请求参数变了...转载 2019-08-23 23:14:05 · 898 阅读 · 4 评论 -
分析ajax爬取头条街拍数据
首先我们需要对该链接中的数据进行爬取:https://www.toutiao.com/search/?keyword=%E8%A1%97%E6%8B%8D1.先试试发起请求,服务器会返回什么数据import requestsdef get_html(url): response = requests.get(url) print(response.text)if...原创 2019-08-29 14:29:05 · 1302 阅读 · 0 评论