今天和大家分享一下我的最大爱好,可想而知一名资深的神经外科主刀医生,被转行做医疗数据,我肯定是个非常内向的人。所以我的最大爱好就是玩王者,感兴趣的可以一起开黑!我的王者号,也叫“飞时过”。今天突然想到,王者本身也是个数字游戏,是非常适合做数据分析的,今天我特意留意了一下,游戏里英雄的各种属性是非常适合做雷达图的,如果王者的运营团队,感兴趣,可以和我合作哦,哈哈,有些自不量力。今天看了吴军老师的《数学之美》,其中对EM算法非常感兴趣,在这本书里是这么表述EM算法的。EM算法只需要有一些训练数据,定义一个最大化函数,剩下的事情就交给计算机了。经过若干次迭代,我们需要的模型就训练好了。这实在是太美妙了,这也许是造物主刻意安排的,所以我把它称作上帝的算法。看看对EM算法评价多高。今天我们就用python干两件事,一个是用EM算法把王者荣耀的英雄按属性做一个分类。另外就是做做英雄属性的可视化。
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.preprocessing import StandardScaler
from sklearn.mixture import GaussianMixture
import os
os.chdir(r'E:\pythoncode_2021_1\EM_data-master')
# 数据加载,避免中文乱码问题
data_original = pd.read_csv('heros.csv', encoding = 'gb18030')
data_original.head().append(data_original.tail()) # 显示前5行和后5行数据
# 对英雄属性之间的关系进行可视化分析
# 设置plt正确显示中文
plt.rcParams['font.sans-serif']=['SimHei'] #用来正常显示中文标签
plt.rcParams['axes.unicode_minus']=False #用来正常显示负号
# 用热力图呈现特征之间的相关性
data = data_original
corr = data.corr()
plt.figure(figsize=(14,14))
# annot=True显示每个方格的数据
sns.heatmap(corr, annot=True)
plt.show()
#我们将 18 个英雄属性之间的关系用热力图呈现了出来,中间的数字代表两个属性之间的关系系数,