如何用爬虫爬取豆瓣网Top250的电影信息
使用正则表达式,模拟浏览器爬取电影信息,将信息保存为Excel形式的文件。
适合初学者,直接复制代码即可运行。
代码如下:
#codeing = utf-8
from bs4 import BeautifulSoup #网页解析,获取数据
import re #正则表达式,文字匹配
import urllib.request,urllib.error #制定URL,获取数据
import xlwt #进行Excel操作
import sqlite3 #进行sqlite数据库操作
#影片详情链接
原创
2020-06-29 21:54:09 ·
634 阅读 ·
0 评论