抓取顶点网小说

最新推荐文章于 2024-04-18 13:54:36 发布

活跃之鱼

最新推荐文章于 2024-04-18 13:54:36 发布

阅读量353

点赞数

文章标签： python

本文链接：https://blog.csdn.net/qq_23246143/article/details/118706960

版权

抓取顶点网小说

来源
抓取

来源

顶点网

抓取

从首页https://www.e1w.net/的类别定位url具体不同值。
在这里插入图片描述

import requests
import re
res=requests.get('https://www.e1w.net/').text
list=re.compile('<li><a href="/list/(\d{1,2})_1\.html">.*?</a></li>').findall(res)
for i in list:
    print(i)

显示

['1', '2', '3', '4', '5', '6', '7', '8', '9', '10']

然后再看1_1.html及其他的下面页面代码
在这里插入图片描述

发现其中的规律，抓取总页数。

l=[]
for i in list:
    url='https://www.e1w.net/list/'+i+'_1.html'
    res=requests.get(url).text
    num=re.compile('<a href="https://www.e1w.net/list/\d{1,2}_(\d{1,3}).html" class="last">').findall(res)[0

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

活跃之鱼

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
抓取顶点网小说

抓取顶点网小说来源抓取来源顶点网抓取mport requestsimport resource = requests.get('https://www.e1w.net/read/70048/index.html').textdemo = re.compile('<td class="L"><a href="(\d+\.html)">(.*?)</a></td>')lists = demo.findall(source)for a,b in l
复制链接

扫一扫