学习分享 | python3异步爬取小说

最新推荐文章于 2023-04-27 16:35:08 发布

今天呆萌了吗

最新推荐文章于 2023-04-27 16:35:08 发布

阅读量604

点赞数

分类专栏：学习分享文章标签： python

本文链接：https://blog.csdn.net/xxhhw/article/details/116531495

版权

最近学了异步/协程，于是想模仿写一个爬取小说的代码
遇到了好几个坑这里记录一下：

导的包

import asyncio
import aiofiles
import requests
from bs4 import BeautifulSoup
from lxml import etree
import aiohttp
import time

主函数

url = 'http://www.purepen.com/sgyy/'

def main():
    head = {
   
        'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0.4324.182 Safari/537.36'
    }
    resp = requests.get(url, headers=head)
    # 将响应解码
    resp.encoding = 'gbk'
    # Xpath解析响应，获取所有的a标签的href值
    t_resp = etree.HTML(resp.text)
    trs = t_resp.xpath('/html/body/center/table[2]//a/@href')

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

今天呆萌了吗

关注关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
学习分享 | python3异步爬取小说

最近学了异步/协程，于是想模仿写一个爬取小说的代码遇到了好几个坑这里记录一下：导的包import asyncioimport aiofilesimport requestsfrom bs4 import BeautifulSoupfrom lxml import etreeimport aiohttpimport time主函数url = 'http://www.purepen.com/sgyy/'def main(): head = { 'User-Ag
复制链接

扫一扫