漫客栈数据采集学习

最新推荐文章于 2024-03-23 17:36:05 发布

xinjiez

最新推荐文章于 2024-03-23 17:36:05 发布

阅读量811

点赞数

文章标签： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xinjiez/article/details/133419141

版权

本文介绍了使用Python进行数据采集，通过正则表达式匹配网页内容，从漫客栈获取漫画章节信息，并进一步提取图片URL。接着，对接漫城的API，将数据入库。整个过程涉及HTTP请求、正则表达式解析和JSON数据交互。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

import requests

import re

from urllib.parse import urlparse, urlunparse

url = "https://www.mkzhan.com/category/?is_free=1&page=1"

# 发送HTTPS请求

response = requests.get(url)

content = response.text

# 使用正则表达式匹配目标地址和名称

pattern = r'<p class="comic__title"><a href="([^"]+)"[^>]*>(.*?)<\/a><\/p>'

matches = re.findall(pattern, content)

# 打印匹配的地址和名称

for match in matches:

address = "https://www.mkzhan.com" + match[0]

name = match[1]

print("地址:", address)

print("名称:", name)

# 发送章节的GET请求

chapter_response = requests.get(address)

chapter_content = chapter_response.text

# 使用正则表达式匹配章节地址和id

chapter_pattern

最低0.47元/天解锁文章

博客等级

码龄3年

6
原创

0
点赞

2
收藏

0
粉丝

关注

私信

热门文章

分类专栏

开源 1篇
api 1篇
腾讯视频 1篇
影视 1篇

展开全部收起

最新评论

腾讯视频分级地址PY获取思路
CSDN-Ada助手: 恭喜你开始写博客了！标题看起来很有趣，我期待能够看到你分享关于腾讯视频分级地址PY获取的思路。不过，我建议在写作时多加入一些具体的案例或者实际操作的步骤，这样读者可以更好地理解你的思路。希望你能够继续坚持写作，加油！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1
漫客栈数据采集学习
CSDN-Ada助手: 非常棒的博文！很高兴看到你对漫客栈数据采集有着浓厚的兴趣，并且愿意分享学习交流的心得体会。希望你能够继续坚持创作，不断分享你的学习成果和经验，让更多的人受益。除了python采集漫客栈图片的内容，我想分享一些和数据采集相关的扩展知识和技能，比如数据清洗和处理、数据可视化、数据分析等等。希望这些能够对你的学习和创作有所帮助。期待看到你更多的精彩内容！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
低端影视采集解密mp4发布
CSDN-Ada助手: 恭喜博主能够持续创作，分享有关低端影视采集解密mp4发布的内容。希望您能够继续保持创作的热情，不断挖掘影视采集解密方面的知识，并且可以适当拓展其他相关的内容，让读者们能够有更多的收获。期待您的下一篇作品！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
芒果视频采集入库苹果cmsv10
CSDN-Ada助手: 恭喜你成功完成了这次芒果视频采集入库苹果cmsv10的工作，看来你对这方面的技术已经有了相当的熟练掌握。希望你能继续保持创作的热情，不断分享自己的经验和成果。或许下一步可以尝试结合其他类型的视频资源，探索更多的可能性，为读者带来更丰富的内容。加油！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
木偶人app通杀地址采集
CSDN-Ada助手: 恭喜您发布了第5篇博客！看到标题我非常兴奋，因为我对木偶人app也非常感兴趣。您的内容一定非常有价值，我期待着能够阅读到您的分享。希望您可以继续保持创作的热情，同时也建议您可以考虑增加一些实用的技术操作指南，这样可以帮助更多的读者更好地理解和应用您所分享的内容。期待您的下一篇作品！

大家在看

最新文章

目录

展开全部

收起

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。