Python爬虫：5_爬取豆瓣Top250电影

最新推荐文章于 2024-06-28 10:31:48 发布

明天不吃肉

最新推荐文章于 2024-06-28 10:31:48 发布

阅读量411

点赞数

文章标签： python 爬虫开发语言

本文链接：https://blog.csdn.net/weixin_45743734/article/details/122493517

版权

本文介绍如何使用Python进行网络爬虫，详细阐述了爬取豆瓣Top250电影的完整过程，包括代码实现和最终展示的效果。

摘要由CSDN通过智能技术生成

代码

import requests
import re
import csv

#　拿取页面源代码
url = 'https://movie.douban.com/top250'
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/94.0.4606.81 Safari/537.36'
}
resp = requests.get(url, headers=headers)
page_content = resp.text

# 解析数据
obj = re.compile(r'<li>.*?<div class="item">.*?<span class="title">(?P<name>.*?)'
                 r'</span>.*?<p class="">.*?<br>(?P<year>.*?)&nbsp.*?<span '
                 r'class="rating_num" property="v:average">(?P<score>.*?)</span>.*?'
                 r'<span>(?P<num>.*?)人评价</span>', re.S)

ret = obj.finditer(page_content)

f = open('data.csv', mode='w')
csvwriter = cs

最低0.47元/天解锁文章

明天不吃肉

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
Python爬虫：5_爬取豆瓣Top250电影

代码import requestsimport reimport csv#　拿取页面源代码url = 'https://movie.douban.com/top250'headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/94.0.4606.81 Safari/537.36'}resp = request
复制链接

扫一扫