爬取豆瓣电影TOP250

最新推荐文章于 2024-06-25 03:17:30 发布

qq_37294892

最新推荐文章于 2024-06-25 03:17:30 发布

阅读量431

点赞数

分类专栏： python学习爬虫文章标签：爬虫练习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_37294892/article/details/102846244

版权

python学习同时被 2 个专栏收录

4 篇文章 0 订阅

订阅专栏

1 篇文章 0 订阅

订阅专栏

##爬取豆瓣电影TOP250

import requests
from bs4 import BeautifulSoup
import codecs

#定义函数将电影名称和url保存到字典中
dic= {}
def get_movie(url):
response=requests.get(url)
mysoup = BeautifulSoup(response.text,‘html.parser’)
for new in mysoup.select(’.item’):
moview_url = new.select(‘a’)[0][‘href’]
moview_name = new.select(’.title’)[0].text
dic[moview_name]=moview_url

#将所有的翻页url保存到列表中
all_url = []
for num in range(0,275,25):
all_url.append(‘https://movie.douban.com/top250?start=’+ str(num) + ‘&filter=’)

#遍历url进行每页的电影爬取
for url in all_url:
get_movie(url)

#保存在文件中
with codecs.open (‘movie_top250.txt’ , ‘w’ ,encoding =‘utf-8’) as f:
for name in dic:
f.write(name + ’ '+ dic[name] + ‘\n’)

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
爬取豆瓣电影TOP250

##爬取豆瓣电影TOP250import requestsfrom bs4 import BeautifulSoupimport codecs#定义函数将电影名称和url保存到字典中dic= {}def get_movie(url):response=requests.get(url)mysoup = BeautifulSoup(response.text,‘html.parser...
复制链接

扫一扫

专栏目录

qq_37294892 CSDN认证博客专家 CSDN认证企业博客

码龄8年

5: 原创

127万+: 周排名

46万+: 总排名

1888: 访问

: 等级

72: 积分

0: 粉丝

0: 获赞

1: 评论

2: 收藏

私信

关注

热门文章

分类专栏

爬虫 1篇
linux 2篇
python学习 4篇

最新评论

爬取豆瓣电影TOP250
CSDN-Ada助手: 非常感谢CSDN博主分享的《爬取豆瓣电影TOP250》博客，这篇博客给我们带来了很多启发。我觉得可以写一篇关于如何使用Python爬取其他网站数据的技术文章，特别是那些需要登录或反爬的网站。这样的技术文章对其他用户学习Python爬虫会有很大帮助。下一篇你可以继续就Python爬虫的相关技术展开，相信会有更多读者受益。加油！为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。