python爬虫|爬取豆瓣电影TOP250并写入txt中

本文介绍了使用Python 3.6和IDLE开发的一个爬虫项目,目标是抓取豆瓣电影Top250的电影排名、名称和评分。通过分析网页源代码并编写正则表达式,作者成功获取所需信息,并调用相关函数实现了数据的爬取。最终,爬取的数据被保存到TXT文件中。
摘要由CSDN通过智能技术生成
   

在mooc上学习了python爬虫,就像自己写一个试试,正好自己也对电影方面感兴趣,所以做了一个关于豆瓣的爬虫。

python版本:3.6

工具:IDLE

爬取内容:TOP250电影的排名,名称,评分

选取网站:https://movie.douban.com/top250

查看源代码(截取部分):

通过这里找到所需提取的信息,编写正则表达式

reRank = r'<em cla
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值