相信大家多多少少都会看看小说,正规的渠道又要付费,免费的广告又多,非常影响阅读。
本人高一学Python也有半年了,最近也会看看小说,下面就用Python的爬虫来实现把小说下载到本地。这里我就以《黄泉禁忌》为例
from urllib import request
from random import choice
import re
#获取请求数据
def reponse(url,agent):
headers = {
'User-Agent':agent}
#构造处理对象
httpHandler = request.HTTPHandler()
'''
由于本项目中并不需要使用代理IP
所以就不加了
proxy = {'http':' 代理IP '}
proxyHandler = request.ProxyHandler(proxy)
'''
#自定义opener
#如果使用了代理IP则需要加上proxyHandler参数
opener = request.build_opener(httpHandler)
#构造请求对象
req = request.Request(url,headers=headers)
data = opener.open(req).read(<