Python爬虫取内容

很简短的代码,就这么轻松。以后用Python爬虫还是很方便的


import requests 
import parsel   

url = "https://read.qidian.com/chapter/WabWC9H2Nk3u4xLcYRGW6w2/1OKBFbasoeL4p8iEw--PPw2/"

response = requests.get(url) 

# 如遇乱码,则去找乱码的字符集  再使用  response.encoding = 'utf-8' / 'gbk' 转码
selector =  parsel.Selector(response.text)

title = selector.css('.text-head > h3 > span.content-wrap::text').get() # 截取标题
content_list = selector.css('#j_719261579').getall()    # 截取内容
content = ''.join(content_list)     # 将内容转为字符串

#   写入文件
with open(title + '.txt', 'w', encoding='utf-8') as f:
    f.write(title)
    f.write('\n')
    f.write(content)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值