数据及背景
https://tianchi.aliyun.com/competition/entrance/531883/introduction?spm=5176.12281949.1003.10.7d292448SgD9yV(阿里天池-零基础入门数据挖掘)
问题分析
改题目是一个多分类问题,通过对心跳信号组成的序列分析从而预测出该信号属于哪一类人,总的来说是一种经典的多分类问题
评价标准
该比赛评价预测精度的方式为:针对某一信号,若真实值为:
[
y
1
,
y
2
,
y
3
,
y
4
]
[y_1, y_2, y_3, y_4]
[y1,y2,y3,y4],模型的预测概率值为:
a
1
,
a
2
,
a
3
,
a
4
a_1, a_2, a_3, a_4
a1,a2,a3,a4,那么该模型的平均值表
a
b
s
−
s
u
m
abs-sum
abs−sum为:
a
b
s
−
s
u
m
=
Σ
j
=
1
n
Σ
i
=
1
4
∣
y
i
−
a
i
∣
abs-sum = \Sigma_{j=1}^{n}\Sigma_{i=1}^{4}|y_i-a_i|
abs−sum=Σj=1nΣi=14∣yi−ai∣
例如:心跳信号为1,会通过编码转成
[
0
,
1
,
0
,
0
]
[0,1,0,0]
[0,1,0,0],预测不同心跳信号概率为
[
0.1
,
0.7
,
0.1
,
0.1
]
[0.1, 0.7,0.1,0.1]
[0.1,0.7,0.1,0.1],那么这个预测结果的
a
b
s
−
s
u
m
abs-sum
abs−sum为
a
b
s
−
s
u
m
=
∣
0.1
−
0
∣
+
∣
0.7
−
1
∣
+
∣
0.1
−
0
∣
+
∣
0.1
−
0
∣
=
0.6
abs-sum=|0.1-0|+|0.7-1|+|0.1-0|+|0.1-0|=0.6
abs−sum=∣0.1−0∣+∣0.7−1∣+∣0.1−0∣+∣0.1−0∣=0.6