目标效果:
代码:
#-*- codeing =utf-8 -*-
#################引入模块#################
from bs4 import BeautifulSoup #网页解析,获取数据
import re #正则表达式,
import urllib.request,urllib.error #制定URL,获取网页数据
import xlwt #进行excel制作
#################定义变量#################
findLink=re.compile(r'<a href="(.*?)">') #创建正则表达式对象,影片链接规则
findImgSrc=re.compile(r'<img.*src="(.*?)"',re.S) #图片链接规则
findTitle=re.compile(r'<span class="title">(.*)</span>') #影片片名
findRating=re.compile(r'<span class="rating_num" property="v:average">(.*)</span>')
findJudge=re.compile(r'<span>(\d*)人评价</span>') #评价人数
findInq=re.compile(r'&l