aiohttp异步爬虫

使用异步aiohttp请求,获取笔趣阁的小说

笔趣阁的url https://biquge96.com/

先在里面找到你想爬取的小说
我获取的是万古第一神这本小说
我这里就先获取前十张的内容

import asyncio
import aiohttp
import logging
from aiohttp import TCPConnector
from parsel import Selector
import requests
logging.basicConfig(level=logging.INFO,
                    format='%(asctime)s - %(levelname)s: %(message)s')

INDEX_URL = "https://biquge96.com{id}"
# 这样写是为了后面的代码拼接
headers = {
   
    "user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/99.0.4844.74 Safari/537.36 Edg/99.0.1150.52"
}

session = None

MONGO_CONNECTION_STRING = 'mongodb://localhost:27017'
MONGO_DB_NAME = 'xiaoshuo'
MONGO_COLLECTION_NAME = 'wgdy'

from motor.motor_asyncio import AsyncIOMotorClient
# ↑ 异步存储库需要用到这个

client = AsyncIOMotorClient(MONGO_CONNECTION_STRING)
db = client[MONGO_DB_NAME]
collection = db[MONGO_COLLECTION_NAME]


def get_url():
    """
    先用requests.get()请求获取这本小说每个章节对应的id
    在合并成每个章节的url,将它们添加到列表中
    最后返回所以url的列表
    :return:
  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值