致敬达叔!Python带你回顾达叔出演过的作品与合作过的演员

大家好,说到吴孟达,他和周星驰的喜剧可是我们少时美好记忆里的不可或缺的一部分。

致敬达叔!Python带你回顾达叔出演过的作品与合作过的演员

达叔

星爷已经转到幕后很久了,而达叔其实一直都有活跃在荧幕。2019年国产高票房科幻电影《流浪地球》里的姥爷韩子昂,今年刚上线不久的网络电影《少林寺之得宝传奇》里的客商老者。达叔一直都在带给我们快乐与感动,可惜这些都在今后成为回忆,定格在了2021年2月27日。

今天,我们通过Python爬取豆瓣里达叔的238部作品,看看那些年, 达叔出演过的作品与合作过的演员们。

大家可以在公众号聊天框 回复 0303 获取 达叔全部作品详情数据、爬虫代码和图表词云绘制代码文件。

目录:

1. 那些年达叔出演过的作品

1.1. 达叔作品上线时间分布

1.2. 达叔作品类型分布

1.3. 达叔作品的分类

1.4. 达叔作品豆瓣评价

1.5. 达叔作品评分分布

1.6. 达叔作品的评价数分布

2. 那些年达叔合作过的他们

2.1. 达叔合作过的导演

2.2. 达叔合作过的演员

3. 达叔获得过的奖项

4. 豆瓣作品详情爬虫代码

1. 那些年达叔出演过的作品

从豆瓣数据显示,达叔最早上线的作品是1975年香港TVB电视台播映的古装短篇剧集《宋江怒杀阎婆惜》,这部剧里还有大家熟悉的发哥。在至今的46年里,达叔作品238部,平均每年高达5部有余

1.1. 达叔作品上线时间分布

从1975年至今的46年时间里,达叔基本上每年都有作品上线,其作品上线最多的年份在90-93年,像《赌神系列》、《逃学威龙系列》、《整蛊专家》、《审死官》、《鹿鼎记》、《武状元苏乞儿》等经典都是在这几年上线的。像我们更熟知的《大话西游系列》则是在95年上线,《喜剧之王》和《少年足球》分别在99年和01年上线。

致敬达叔!Python带你回顾达叔出演过的作品与合作过的演员

达叔作品上线时间分布

1.2. 达叔作品类型分布

在达叔238部作品中有67部电视剧171部电影,其中83版的《射雕英雄传》里达叔出演的是丐帮净衣帮彭长老,彼时的星爷是宋兵乙。除此之外,我比较熟悉的还有他和曹骏、释小龙主演的《九岁县太爷》。

致敬达叔!Python带你回顾达叔出演过的作品与合作过的演员

电视剧与电影占比

1.3. 达叔作品的分类

达叔的作品主要以喜剧为主,我少时记忆里达叔就是一个无厘头搞笑的形象。

致敬达叔!Python带你回顾达叔出演过的作品与合作过的演员

分类形式

1.4. 达叔作品豆瓣评价

达叔的作品,在豆瓣有评价的共177部,其中电影较多有134部,电视剧有43部。

以下树状热力图中,颜色越深代表评分越高(更受观众喜欢),面积越大代表评价数越多(更火)。咱们可以看到最火的依次是《流浪地球》、《大话西游系列》、《喜剧之王》和《九品芝麻官》,这其中《大话西游系列》最受观众喜欢,评分超高都在9分+。

致敬达叔!Python带你回顾达叔出演过的作品与合作过的演员

达叔作品豆瓣评价

1.5. 达叔作品评分分布

达叔出演过的电视剧评分基本都在6分左右及以上,达叔出演过的电影则大部分集中在6-8分。

致敬达叔!Python带你回顾达叔出演过的作品与合作过的演员

达叔作品评分分布

达叔作品中评分前五:

致敬达叔!Python带你回顾达叔出演过的作品与合作过的演员

评分前5的作品

1.6. 达叔作品的评价数分布

除了电视剧普遍都是较低评价数之外,达叔的高分电影的评价数也都较多。

致敬达叔!Python带你回顾达叔出演过的作品与合作过的演员

达叔作品的评价数分布

达叔作品中评价数前五:

致敬达叔!Python带你回顾达叔出演过的作品与合作过的演员

评价数前5的作品

2. 那些年达叔合作过的他们

和达叔合作过的导演有166位(同一部电影或电视剧都存在多个导演),演员则高达1,157位(豆瓣作品详情页记录的演员)。

2.1. 达叔合作过的导演

和达叔合作过的166位导演中,与朱延平合作14次,和王晶合作13次,同杜琪峰合作10次。

《赌神系列》、《九品芝麻官》、《鹿鼎记》和《整蛊专家》等都是王晶导演作品;

和朱延平导演合作的作品中比较知名的大概就是周杰伦主演的08年上线的《大灌篮》;

像电视剧《射雕英雄传》和电影《阿郎的故事》则是达叔与杜琪峰和王天林导演合作过的。

致敬达叔!Python带你回顾达叔出演过的作品与合作过的演员

和达叔合作过的导演云图

2.2. 达叔合作过的演员

达叔合作过的演员则高达1,157位,其中星爷首屈一指,合作剧作高达30部+,其次是黄一飞张敏的21部以及华仔的18部。

与星爷合作的30不戏除了01年的《少年足球》之前,其余全部为上个世纪的作品,不过星爷作为演员在01年之后也只出演过三部电影而已;

致敬达叔!Python带你回顾达叔出演过的作品与合作过的演员

月光宝盒

有黄一飞的地方也基本都是有星爷的地方,也就是基本上有达叔的地方;

基本上在90-93年之间达叔的戏,星爷、张敏、华仔都在咯。

致敬达叔!Python带你回顾达叔出演过的作品与合作过的演员

和达叔合作过的演员云图

3. 达叔获得过的奖项

致敬达叔!Python带你回顾达叔出演过的作品与合作过的演员

达叔荣誉

4. 豆瓣作品详情爬虫代码

这里不介绍详情爬虫过程了,直接贴源码:

思路:从个人页作品列表中找到每个作品的详情页采集详情数据。

-- coding: utf-8 --

“”"

Created Feb 28 10:30:56 2021

@author: 可以叫我才哥

“”"

importrequests

importre

importpandasaspd

importhtml

fromlxmlimportetree

fromtqdmimporttqdm

importrandom

importtime

defget_html(url):

time.sleep(1)

headers = {

“User-Agent”:“Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.66 Safari/537.36”,

}

作为演员

r = requests.get(url, headers=headers)

请求的网页数据中有网页特殊字符,通过以下方法进行解析

r = html.unescape(r.text)

r = re.sub(’:\xa0’,’’, r)

returnr

url =‘https://movie.douban.com/celebrity/1016771/movies?start=0&format=pic&sortby=time&role=A1’

r = get_html(url)

获取页数

pages = int(re.findall(

r’(共(\d+)条)’, r)[0])//10+1

works = []

forpageintqdm(range(15,pages)):

url =f’https://movie.douban.com/celebrity/1016771/movies?start={page*10}&format=pic&sortby=time&role=A1’

r = get_html(url)

r_html = etree.HTML®

找到每页剧目信息列表所在的节点

ul = r_html.xpath(’//*[@id=“content”]/div/div[1]/div[2]/ul’)[0]

找到每页全部的剧目列表

lis = ul.xpath(’./li’)

forliinlis:

work = {}

work[‘url’] = li.xpath(’.//dl/dt/a/@href’)[0]

r_info = get_html(work[‘url’])

r_info_html = etree.HTML(r_info)

a = r_info_html.xpath(’//div[@id=“info”]//text()’)

b =’’.join(a)

c = b.replace(’ ‘,’’)

d = re.sub(r’\n+’,’\n’, c)

e = d.split(’\n’)

keys = [i.split(’:’)[0]foriine[1:-1]]

values = [i.split(’:’)[1]foriine[1:-1]]

work.update(dict(zip(keys, values)))

work[‘作品名称’] = li.xpath(’.//h6/a/text()’)[0]

work[‘年份’] = re.findall(r’(\d+)’, li.xpath(’.//h6/span/text()’)[0])[0]

try:

work[‘评分’] = li.xpath(’.//dl/dd//div/span[2]/text()’)[0]

work[‘评价数’] = li.xpath(’.//dl/dd//div/span[3]/text()’)[0]

except:

pass

works.append(work)

df = pd.DataFrame(works)

如果你符合下面的情况中的任意一条,那我十分建议你加入跟着一起学习

1.准备从事编程工作,但是不知道选择什么语言好

2.只掌握了Python基础,缺乏系统性的学习以及企业级项目实战,达不到求职的能力

3.有一定Python基础,但是求职屡屡碰壁,各种问题频繁暴露,甚至怀疑自己不适合做开发

4.准备转行从事开发的同学

5.年满18即可

6.想利用Python副业月入3000-80000

图片

****扫码二维码领取Python学习试学课程+课程咨询!

领取福利加小姐姐微信:python7762

免费领取学习+课程规划

图片.png

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值