笔趣阁爬虫

笔趣阁爬虫

import requests
import time
from bs4 import BeautifulSoup
import os
def Get_content(url):
    urls2=[]
    res=requests.get(url).content.decode('gbk')
    soup=BeautifulSoup(res,"html.parser")

    contents=soup.find_all("div",attrs={
   "class":"nav"})
    for content in contents:
        lis=content.find_all("li")
        for li in lis:

            urls2.append(li.a.get("href"))
    return urls2
def Get_url3(urls):
    urls3=[]
    for url in urls:
        res = requests.get(url).content.decode('gbk')
        soup = BeautifulSoup(res, "html.parser")
        #
        contents=soup.find_all("div",attrs={
   "class":"l"})

        #热门小说
        contents2=soup.find_all("div",attrs={
   "class":"r"})
        #玄幻小说,仙侠小说,都市言情小说
        contents3=soup.find_all("div",attrs={
   "class":"novelslist"})
        #更新小说
        contents4=soup.find_all("div",attrs={
   "id":"newscontent"})
        for i,content in enumerate(contents):
            dts=content.find_all("dt")
            for dt in dts:

                try:
                    urls3.append(dt.a.get("href"))
                except Exception as e:
                    print(i)
        for c in contents2:
            lis=c.find_all("li")
            for li in lis:
                urls3.append(li.a
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值