对Top100电影的数据分析及可视化Python

分析内容:

分析1: Top100电影地区分布

分析2: Top100电影上映年份分布

分析3: Top100电影风格分布

import operator

import pandas as pd  # 读取csv文件
import matplotlib.pyplot as plt  # 画图
#from wordcloud import WordCloud  # 词云图
# 解决中文显示问题
plt.rcParams['font.sans-serif'] = ['SimHei']  # 显示中文标签  # 指定默认字体
plt.rcParams['axes.unicode_minus'] = False  # 解决保存图像是负号'-'显示为方块的问题
# 读取csv数据
df = pd.read_csv('maoyan.csv')
df[['year','place']]=df['pub_time'].str.split('(',expand=True)
df.drop('pub_time',axis=1,inplace=True)
df['year']=df['year'].str[:4]
df['place']=df['place'].str[:-1]
def change_region(region):
    if region=="中国香港":
        return '中国'
    else:
        return region
df['place']=df['place'].map(change_region)
list_=df['place'].tolist()
d=dict([[i,list_.count(i)] for i in list_])
x=[]
y=[]
for key,value in d.items():
    if key!=None:
     x.append(key)
     y.append(value)

plt.bar(x, y)
plt.xlabel("国家")
plt.ylabel("数量")
plt.title("Top100电影地区分布")
plt.legend()
#plt.show()

d={'10年后':0,'00年后':0,'90年代':0,'90年前':0}
list_=df['year'].tolist()
for year in list_:
    if int(year)>2010:
        d['10年后']=d['10年后']+1
    elif int(year)>=2000:
        d['00年后'] = d['00年后'] + 1
    elif int(year)>=1990:
        d['90年代'] = d['90年代'] + 1
    elif int(year)<1990:
        d['90年前'] = d['90年前'] + 1
x.clear()
y.clear()
for key,value in d.items():
    if key!=None:
     x.append(key)
     y.append(value)

explode=[0.01,0.01,0.01,0.01]
plt.figure(figsize=(6,6))
plt.pie(y,explode=explode,labels=x,autopct='%1.1f%%')
plt.title('Top100电影上映年份分布')
plt.show()


allStyle={}
for i in df['style'].str.split(','):
    for j in i:
        if j not in allStyle:
            allStyle[j]=1
        else:
            allStyle[j]=allStyle[j]+1
x.clear()
y.clear()
allStyle=dict(sorted(allStyle.items(),key=operator.itemgetter(1)))
for key,value in allStyle.items():
     x.append(key)
     y.append(value)
     
plt.barh(x,y)
plt.title('Top100电影风格')
plt.xlabel('数量')
plt.ylabel('风格名称')
plt.show()

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值