笔趣阁爬虫

最新推荐文章于 2024-03-24 18:00:20 发布

qestion_yz_10086

最新推荐文章于 2024-03-24 18:00:20 发布

阅读量697

点赞数

分类专栏：爬虫文章标签： python

本文链接：https://blog.csdn.net/qestion_yz_10086/article/details/106496570

版权

笔趣阁爬虫

import requests
import time
from bs4 import BeautifulSoup
import os
def Get_content(url):
    urls2=[]
    res=requests.get(url).content.decode('gbk')
    soup=BeautifulSoup(res,"html.parser")

    contents=soup.find_all("div",attrs={
   "class":"nav"})
    for content in contents:
        lis=content.find_all("li")
        for li in lis:

            urls2.append(li.a.get("href"))
    return urls2
def Get_url3(urls):
    urls3=[]
    for url in urls:
        res = requests.get(url).content.decode('gbk')
        soup = BeautifulSoup(res, "html.parser")
        #
        contents=soup.find_all("div",attrs={
   "class":"l"})

        #热门小说
        contents2=soup.find_all("div",attrs={
   "class":"r"})
        #玄幻小说,仙侠小说，都市言情小说
        contents3=soup.find_all("div",attrs={
   "class":"novelslist"})
        #更新小说
        contents4=soup.find_all("div",attrs={
   "id":"newscontent"})
        for i,content in enumerate(contents):
            dts=content.find_all("dt")
            for dt in dts:

                try:
                    urls3.append(dt.a.get("href"))
                except Exception as e:
                    print(i)
        for c in contents2:
            lis=c.find_all("li")
            for li in lis:
                urls3.append(li.a

最低0.47元/天解锁文章

qestion_yz_10086

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
笔趣阁爬虫

笔趣阁爬虫import requestsimport timefrom bs4 import BeautifulSoupimport osdef Get_content(url): urls2=[] res=requests.get(url).content.decode('gbk') soup=BeautifulSoup(res,"html.parser") contents=soup.find_all("div",attrs={"class":"nav"})
复制链接

扫一扫