爬虫练习项目之电影天堂下载链接爬取

最新推荐文章于 2024-05-04 14:23:21 发布

嘎嘎的可达鸭

最新推荐文章于 2024-05-04 14:23:21 发布

阅读量635

点赞数 2

文章标签：爬虫

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_74802171/article/details/135962218

版权

本文介绍了如何使用Python的requests和正则表达式(re)库，爬取电影天堂网站的2024必看热片板块，提取影片名和下载地址，并在控制台上打印结果。

摘要由CSDN通过智能技术生成

import requests
import re 
mainlink="https://dytt89.com/"
ua={"User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36"}
respmain=requests.get(mainlink,headers=ua)
respmain.encoding="gb2312`"
# print(respmain.text)
respmain.close  # 已经拿到主页面数据respmain.text,关闭主页面

# 对主页面数据进行解析
objmain=re.compile(r"2024必看热片.*?<ul>(?P<nr>.*?)</ul>",re.S)

# 对主页面拿到的2024必看影片目录进行解析,拿到主链接后缀
obj1=re.compile(r"<li><a href='(?P<suffix>.*?)'",re.S)

# 对子页面解析,拿到影片名和下载地址
obj3=re.compile(r'◎片　　名(?P<name>.*?)<br />.*?WORD-WRAP.*?<a href="(?P<xzdz>.*?)</a>',re.S)
for it in objmain.finditer(respmain.text):
    # print(it.group("nr").strip())
    for iit in obj1.finditer(it.group("nr").strip()):
        #print(iit.group("suffix").strip('/'))
        url=mainlink+iit.group("suffix").strip('/')
        # print(url)
        resp=requests.get(url,headers=ua)
        resp.encoding="gb2312"
        resp.close()
        # print(resp.text)
        for iiit in obj3.finditer(resp.text):
            print(f"影片名:{iiit.group("name")}\n下载地址:{iiit.group("xzdz")}\n\n")

可以把爬取到的电影天堂的电影名字和下载链接在控制台中打印出来,如果需要更改爬取的板块,可以直接修改第11行代码中的"2024必看热片"

嘎嘎的可达鸭

关注

2
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

嘎嘎的可达鸭 CSDN认证博客专家 CSDN认证企业博客

码龄2年

4: 原创

158万+: 周排名

26万+: 总排名

4074: 访问

: 等级

64: 积分

7: 粉丝

18: 获赞

6: 评论

68: 收藏

私信

关注

热门文章

分类专栏

C++ 1篇
歌手成绩管理(C语言) 1篇

最新评论

(C++)5分钟带你了解指针,引用,值传递,引用传递,指针传递,返回值,返回引用的区别
小小心澄: 写的很好！赞一个
(C++)5分钟带你了解指针,引用,值传递,引用传递,指针传递,返回值,返回引用的区别
CSDN-Ada助手: 非常感谢作者分享这篇博客！标题非常吸引人，内容也非常有价值。对于初学者来说，理解指针、引用以及不同传递方式的区别确实是一个重要的知识点。通过这篇博客，我对这些概念有了更清晰的认识。在下一步的创作中，我建议作者可以进一步探讨这些概念在实际编程中的应用场景和注意事项。例如，可以结合具体的案例或实例，通过代码演示来说明不同的传递方式在不同情况下的优势和适用性。这样可以帮助读者更深入地理解这些概念，并将其应用到实际的编程项目中。再次感谢作者的分享，并期待更多优质的博客文章！祝愿作者在创作的道路上不断进步，为读者带来更多有价值的内容。 CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
C语言,成绩管理系统
CSDN-Ada助手: 非常感谢您分享这篇关于成绩管理系统的博客！看到您已经实现了多项功能，非常厉害！希望您能够继续创作，不断提高自己的编程技能。除了已经提到的功能，您还可以考虑增加一些安全性方面的功能，比如密码保护和数据备份等。同时，也可以学习一些数据结构和算法知识，来优化程序的性能。期待您的下一篇博客！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
C语言,歌手比赛成绩管理系统
CSDN-Ada助手: C 技能树或许可以帮到你：https://edu.csdn.net/skill/c?utm_source=AI_act_c

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。