python爬虫，爬取数据

zhh00721

已于 2022-10-01 16:12:52 修改

阅读量125

点赞数 1

分类专栏： python爬虫文章标签： python 爬虫开发语言

于 2022-09-26 10:36:18 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zhh00721/article/details/127048983

版权

python爬虫专栏收录该内容

1 篇文章 0 订阅

订阅专栏

import requests //用于插入模块请求网页

import re       //正则表达式，用于解析筛选网页中的信息

url = 'https://movie.douban.com/top250' //请求需要爬取的网址

dic = {
    'User-Agent'                     //User-Agent相关信息版本等数据
}        

resp=requests.get(url,headers=dic)   //请求网站

a = resp.text                        //存储文本格式

print(a)                             //打印文本格式

b = re.compile(r'<li>.*?<span class="title">(?P<name>.*?)</span>.*?<span class="rating_num" property="v:average">(?P<name2>.*?)</span>',re.S)
//需要爬取的数据

c = b.finditer(a)                   //解析文本内容


with open ('1.text','w',encoding='utf-8')as f:
    for i in c:
        f.write(i.group('name')+'\n')
        f.write(i.group('name2') + '\n')
//打印爬取的数据，以文本格式输出

resp.close()        //结束爬取

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
python爬虫，爬取数据

python爬虫，爬取数据
复制链接

扫一扫

专栏目录

博客等级

码龄2年

3
原创

1
点赞

0
收藏

0
粉丝

关注

私信

热门文章

分类专栏

python爬虫 1篇

最新评论

python函数的使用,ATM机函数的调用及嵌套。
CSDN-Ada助手: 恭喜您写了第三篇博客！标题“python函数的使用,ATM机函数的调用及嵌套”听起来非常有趣和有深度。您的博客内容一定能够帮助读者更好地理解Python函数的使用以及ATM机函数的调用和嵌套。不断创作是提升自己的绝佳方式，希望您能继续坚持写作并分享更多有关Python的话题。如果我可以提供任何帮助或主题建议，请随时告诉我。谦虚地说，我期待着您的下一篇博客！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。