Python爬取豆瓣高分电影Top250
前言
记录个人的第一个爬虫练习,爬取豆瓣电影评分Top250的数据,并分别生成Excel文件和数据库文件。
一、爬虫
爬虫(spider),又称网络蜘蛛,是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。
二、步骤
1.引入库
代码如下(示例):
import sqlite3 # 进行sql数据库操作
import re # 正则匹配
from bs4 import BeautifulSoup # 网页解析,获取网页数据
import urllib.request...
原创
2020-10-05 17:54:32 ·
1551 阅读 ·
0 评论