Python 简单爬虫下载小说txt
#第一次写爬虫代码 欢迎交流指正
我们范例爬取的对象是笔趣阁的《圣墟》 (最近非常火的连载小说)
##为什么选择笔趣阁#
主要是因为笔趣阁的源代码没有反爬,像比如精彩小说网使用这个代码爬取时会出现403错误…(这些要绕过一些反爬措施的还不会…)
但笔趣阁的资源已经是比较全的了(我也不知道它是不是盗版)
话不多说
直接上代码
import requests
import re
url = 'https://www.biqiuge.com/book/4772/'
response = requests.get(url)
response.encoding = 'gbk'
html = response.text
#print (html)
title = re.findall(r