Python爬取豆瓣电影“一周口碑排行榜”

最新推荐文章于 2024-07-12 19:06:42 发布

chin_yyy

最新推荐文章于 2024-07-12 19:06:42 发布

阅读量158

点赞数

文章标签： python 开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/chin_yyy/article/details/133948275

版权

利用requests库访问https://movie.douban.com/网站。检查是否出现乱码问题，如有请解决。利用正则表达式提取其中的“一周口碑榜”中的电影列表信息并打印输出。如下图所示：

部分代码如下：

import re
import requests
headers={'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.141 Safari/537.36'
    }
url='https://movie.douban.com/'
response = requests.get(url,headers=headers)
response.encoding=response.apparent_encoding
#print(response.text)

re_str='<td class="order">(.*?)</td>'
#re_std='<td class="title">(.*?)</td>'
re_std='<td class="title"><a onclick=".*?" href=".*?">(.*?)</a>'
result=re.findall(re_str,response.text)
result2=re.findall(re_std,response.text)
item=zip(result,result2)
for z in item:
    variable1, variable2 = z
    print(variable1, variable2)

运行结果：

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
Python爬取豆瓣电影“一周口碑排行榜”

利用requests库访问https://movie.douban.com/网站。检查是否出现乱码问题，如有请解决。利用正则表达式提取其中的“一周口碑榜”中的电影列表信息并打印输出。
复制链接

扫一扫

chin_yyy CSDN认证博客专家 CSDN认证企业博客

码龄2年

4: 原创

155万+: 周排名

29万+: 总排名

1637: 访问

: 等级

49: 积分

27: 粉丝

9: 获赞

2: 评论

14: 收藏

私信

关注

热门文章

最新评论

Chrome谷歌浏览器作为自动测试工具
CSDN-Ada助手: 恭喜你写了第三篇博客！标题“Chrome谷歌浏览器作为自动测试工具”听起来非常有趣。你对这个话题的深入研究和分享对读者来说肯定是非常有价值的。不过，我想提一个谦虚的建议：下一步，你可以考虑探索一下其他浏览器作为自动测试工具的可能性。这样一来，你的读者们会更全面地了解不同浏览器在自动测试方面的优势和不足。期待你未来更多的创作！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
动态爬取网站https://report.amap.com/detail.do?city=110000中武汉的交通数据
CSDN-Ada助手: 恭喜你写下了第四篇博客！标题非常吸引人，你的动态爬取网站的能力令人佩服。了解武汉的交通数据对于我们理解城市发展非常重要，你的博客将为读者提供有价值的信息。在下一步的创作中，我建议你可以进一步探索这些数据的应用。例如，可以分析交通拥堵的原因，提出改善交通流畅性的建议，或是与其他城市进行对比研究等等。通过深入挖掘数据背后的故事，你将能够为读者带来更多见解和启发。请继续保持谦虚的态度，不断努力，我期待着你的下一篇创作！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
Python爬取请求去哪网品质一日游中的门票信息
CSDN-Ada助手: 恭喜你开始博客创作！标题看起来非常有吸引力，我很期待看到你对Python爬取请求去哪网品质一日游中门票信息的实践和经验分享。在下一步的创作中，我建议你可以进一步深入探索Python爬取数据的技巧和方法，以及如何处理和分析爬取的门票信息。期待你的下一篇博客，祝你写作愉快！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1
Python爬取豆瓣电影“一周口碑排行榜”
CSDN-Ada助手: 非常棒的博文！你的技术分享对于想要学习Python爬虫的人来说将会非常有帮助。希望你可以继续分享更多关于Python爬虫的经验和技巧。除了利用requests库进行网页访问和正则表达式提取信息外，你可能还可以探索一些与该博文相关的扩展知识和技能。例如，你可以学习如何使用BeautifulSoup库来解析网页内容，这样可以更方便地提取特定标签下的信息。此外，你还可以尝试使用Selenium库来模拟用户行为，如点击按钮或填写表单。再次感谢你的分享，期待看到更多精彩的博文！不断学习和探索，你的技术水平一定会不断提高的。加油！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

chin_yyy 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。