python 爬取豆瓣电影top250

最新推荐文章于 2024-06-24 15:49:09 发布

diaopanda

最新推荐文章于 2024-06-24 15:49:09 发布

阅读量1.2k

点赞数 2

文章标签： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_50723930/article/details/121990728

版权

该博客介绍了如何使用Python爬虫技术抓取豆瓣电影Top250列表的数据，包括影片链接、图片、名称、评分、评价人数及简介，并将数据存储到SQLite数据库中。同时，还展示了如何使用Flask框架展示爬取到的数据。

摘要由CSDN通过智能技术生成

import urllib.request # z定url，获取网页数据
from bs4 import BeautifulSoup # 网页解析，获取数据
import re # 正则表达式，进行文字匹配
import xlwt # 进行excel操作
import sqlite3 # 进行mysql数据库操作

# 影片详情链接
findlink = re.compile(r'<a href="(.*?)">') # 正则表达式
# 影片图片链接
findimgsrc = re.compile(r'<img.*src="(.*?)"', re.S) # re.S让换行符包含在字符中
# 片名
findtitle = re.compile(r'<span class="title">(.*)</span>')
# 影片评分
findscore = re.compile(r'<span class="rating_num" property="v:average">(.*)</span>')
# 评价人数
findnum = re.compile(r'<span>(\d*)人评价</span>')
# 影片概况
findtext = re.compile(r'<span class="inq">(.*)</span>')
# 影片简介
findall = re.compile(r'<p class="">(.*?)</p>',

最低0.47元/天解锁文章

关注

2
点赞
踩
5

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。