Python 学习 Day33

szxc123123

于 2022-08-04 15:12:53 发布

阅读量72

点赞数

文章标签：学习

本文链接：https://blog.csdn.net/szxc123123/article/details/126159070

版权

def parse_index(html):
all_url = re.findall(r’<a href="(/films/\d+)"target=“blank"data_get=“movies-click"data-vel=”{movieId:\d+}“class=””>.+,
html])
return [http://www.movie.com{}.format(url) for url in all_url]

def parse_info(html):
name = re.findall(r’

(.+)

types = re.findall(r’

(.+)

actors = re.findall(r’<li class = “celebrity actor”.+>\s+<a self = "/films/cel.+>\s+.html

actors = e,xpath('//li[@class = "celebrity actor"]/div['class = "info"]/a/text()')
actors = format_actor(	actor)
return{
			"name":name,
			"types":types,
			"actor":actor
			}