python爬虫
Jie_Ger
杰少就很秀
展开
-
利用python爬取豆瓣读书TOP-250
import reimport requestsfrom bs4 import BeautifulSoupdef book(target_url): books = [] # 使用requests返回网页的整体结构 book = requests.get(target_url) # 使用lxml作为解析器,返回一个Beautifulsoup对象 so...原创 2018-11-20 19:26:24 · 605 阅读 · 0 评论 -
利用python爬取英雄联盟官网英雄皮肤
思路:1、获取JS源代码2、获取英雄ID3、拼接完整路径4、下载的位置5、下载import requestsimport reimport json #获取JS源代码def download_image(): js_url = 'https://lol.qq.com/biz/hero/champion.js' js_html = requests.get...原创 2018-11-20 19:33:53 · 2070 阅读 · 3 评论 -
利用python爬取百度贴吧源码
import requestsclass tieba(object): def __init__(self,tieba_name): self.tieba_name = tieba_name self.start_url = 'https://tieba.baidu.com/f?kw=' + tieba_name + '&ie=utf-8&...原创 2018-11-20 19:40:42 · 613 阅读 · 0 评论