代码:
‘
# pip install seaborn -i https://pypi.tuna.tsinghua.edu.cn/simple
import pandas as pd
import seaborn as sns
import numpy as np
import matplotlib.pyplot as plt
import warnings
warnings.filterwarnings("ignore")#忽略一些警告 不影响运行
import numpy as np
import pandas as pd
data=pd.read_excel("01中国软件-利润表(1).xlsx")
data_inf=[]
for line in data.values:
if len(str(line[1]))>3 and len(str(line[2]))>3 :
print(line)
data_inf.append(line.tolist())
# 两类相关性分析
plt.rcParams['font.sans-serif']=['SimHei']
plt.rcParams['axes.unicode_minus']=False
a_1=data_inf[0][2:-1][:20]
b_1=data_inf[2][2:-1][:20]
print(a_1)
print(b_1)
plt.figure(figsize=(16,8))
plt.title("营业总收入和营业总成本相关性图")
plt.xlabel('营业总收入',fontsize=8)
plt.ylabel('营业总成本',fontsize=8)
plt.scatter(a_1,b_1)
plt.show()
# 两类相关性分析
a_1=data_inf[2][2:-1][:20]
b_1=data_inf[3][2:-1][:20]
plt.figure(figsize=(16,8))
plt.title("营业总成本和营业成本相关性图")
plt.xlabel('营业总成本',fontsize=8)
plt.ylabel('营业成本',fontsize=8)
plt.scatter(a_1,b_1)
plt.show()
# 两类相关性分析
a_1=data_inf[6][2:-1][:20]
b_1=data_inf[7][2:-1][:20]
plt.figure(figsize=(16,8))
plt.title("销售费用和管理费用相关性图")
plt.xlabel('销售费用',fontsize=8)
plt.ylabel('管理费用',fontsize=8)
plt.scatter(a_1,b_1)
plt.show()
#直方图
a_1=data_inf[0][2:-1]
x_close=[i for i in range(len(a_1))]
plt.xlabel('时间',fontsize=8)
plt.ylabel('营业总收入',fontsize=8)
plt.title("营业总收入直方图")
plt.hist(a_1, bins=40, facecolor="red", edgecolor="black", alpha=0.6)
# 显示图标题
plt.show()
#直方图
a_1=data_inf[6][2:-1]
x_close=[i for i in range(len(a_1))]
plt.xlabel('时间',fontsize=8)
plt.ylabel('销售费用',fontsize=8)
plt.title("销售费用直方图")
plt.hist(a_1, bins=40, facecolor="red", edgecolor="black", alpha=0.6)
# 显示图标题
plt.show()
数据+代码+实验报告: