问题记录总结-豆瓣电影评分Top250名称爬取

最新推荐文章于 2021-04-14 12:40:07 发布

AS要努力学习

最新推荐文章于 2021-04-14 12:40:07 发布

阅读量2.2k

点赞数 12

分类专栏： python学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ASerendipity_/article/details/103631762

版权

本文记录了使用Python爬取豆瓣电影Top250和图书Top250名称的过程，涉及requests库、BeautifulSoup解析及反爬虫策略。在爬取过程中，遇到的问题包括字符串空格处理和HTTP响应状态码418，通过调整代码成功解决。

摘要由CSDN通过智能技术生成

碎碎念：
本文代码参考：Python爬虫小白教程（二）—— 爬取豆瓣评分TOP250电影
完整过程请参考上文，解释得非常清楚，感谢！
本文只在记录编写代码中遇到的问题以及知识点的学习（用啥学啥 (๑•̀ㅂ•́)و✧）
就你有时候copy代码吧也不一定能跑出来…
能跑出来吧也不一定就完全弄懂了每一行代码…

文章目录

学习：豆瓣电影Top250名称爬取
举一反三：豆瓣图书Top250名称爬取
参考

学习：豆瓣电影Top250名称爬取

完整代码

先放上完整代码看看。

# 参考：https://blog.csdn.net/weixin_44547562/article/details/103533502
# 2019.12.16
# ASerendipity_
import time
import requests
from bs4 import BeautifulSoup


# 定义获取页面的函数
def get_page(url, params=None, headers=None):
    response = requests.get(url, headers=headers, params=params)
    page = BeautifulSoup(response.text, 'lxml')
    print(response.url)
    print("响应状态码：", response.status_code)

    return page


title_list = []  # 电影名列表
headers = {
   
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/77.0.3865.90 Safari/537.36',
    'Host': 'movie.douban.com'
}
for i in range(11):
    params = {
   "start": (i * 25)}
    page = get_page('https://movie.douban.com/top250', params=params, headers=headers)

    div_list = page.find_all('div', class_='hd')

    for div in div_list

最低0.47元/天解锁文章

AS要努力学习

关注

12
点赞
踩
31

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

AS要努力学习 CSDN认证博客专家 CSDN认证企业博客

码龄5年

10: 原创

106万+: 周排名

18万+: 总排名

1万+: 访问

: 等级

185: 积分

63: 粉丝

57: 获赞

7: 评论

107: 收藏

私信

关注

热门文章

分类专栏

前端 4篇
data structure 1篇
java 1篇
shell
django 1篇
python学习 2篇

最新评论

ES6(ECMAScript 6)有哪些特性？
CSDN-Ada助手: 恭喜您发布了第9篇博客！标题“ES6(ECMAScript 6)有哪些特性？”非常吸引人，探讨了一个热门话题。希望您能继续保持创作的热情和努力，为读者带来更多有价值的内容。或许下一步可以考虑深入探讨ES6的具体应用场景或是与其他版本的比较，让读者更好地了解ES6的特性。期待您的下一篇作品！
什么是TypeScript？与JavaScript有何区别？常考面试题有哪些？
CSDN-Ada助手: 恭喜您撰写了第10篇博客，内容涵盖了TypeScript与JavaScript的区别以及常考面试题，非常有深度和实用性！希望您能继续保持创作的热情和努力，不断拓展内容领域，或许可以考虑深入探讨TypeScript的高级特性或者结合实际案例进行分析，让读者更加深入地了解这个主题。期待您未来更多优质的分享！
异步编程：回调函数(Callback)、Promise 对象和 async/await
CSDN-Ada助手: 恭喜你写了这篇关于异步编程的博客！你对回调函数、Promise 对象和 async/await 的解释很清晰，让我受益匪浅。希望你能继续分享关于编程的知识和经验。下一步，我建议你可以写一些实际案例或者深入探讨某个具体的编程技术，这样可以让读者更好地理解并应用所学知识。期待你的下一篇作品！
问题记录总结-xadmin的安装与使用(未解决，暂时搁置欢迎赐教)
nijianghu 回复前撤步登哥: 没解决，降低django版本吧
问题记录总结-xadmin的安装与使用(未解决，暂时搁置欢迎赐教)
前撤步登哥回复 nijianghu: 同样遇到一毛一样的问题，无法解决若老铁解决请告知

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。