零基础入门心电图心跳信号多分类预测挑战赛-赛题理解
1,比赛地址:https://tianchi.aliyun.com/competition/entrance/531883/introduction
2,比赛任务
以预测心电图心跳信号类别为任务,是一个多分类的预测。
3,查看数据
train_data = pd.read_csv(r"C:\Users\tian\Desktop\杂货店\datawhale\train.csv")
test_data = pd.read_csv(r"C:\Users\tian\Desktop\杂货店\datawhale\testA.csv")
print('Train data shape:',train_data.shape)
print('TestA data shape:',test_data.shape)
#Train data shape: (100000, 3)
#TestA data shape: (20000, 2)
train_data.head()
train_data.info()
test_data.info()
#查看label情况
train_data['label'].value_counts()
#总体分布概况(无界约翰逊分布等)
import scipy.stats as st
y = train_data['label']
plt.figure(1); plt.title('Default')
sns.distplot(y, rug=True, bins=20)
plt.figure(2); plt.title('Normal')
sns.distplot(y, kde=False, fit=st.norm)
plt.figure(3); plt.title('Log Normal')
sns.distplot(y, kde=False, fit=st.lognorm)
关于这三个图,比较有疑惑,这仨图有啥意思,能看出啥????