作业1
1.写出本例中的 U , C , D \mathbf{U}, \mathbf{C}, \mathbf{D} U,C,D和 V \mathbf{V} V。注: 最后两个属性为决策属性
U
=
{
x
1
,
x
2
,
…
,
x
7
}
\mathbf{U}=\{x_1,x_2,\dots,x_7\}
U={x1,x2,…,x7}
C
=
{
\mathbf{C}=\{
C={Headache, Temperature, Lymphocycte, Leukocycte,Eosinophil
}
\}
}
D
=
{
\mathbf{D}=\{
D={Heartbeat, Flu
}
\}
}
D
=
{
\mathbf{D}=\{
D={Yes,No,High,Normal,Low,Abnormal
}
\}
}
2.定义一个标签分布系统, 即各标签的值不是 0/1, 而是 [ 0 , 1 ]区间的实数, 且同一对象的标签和为 1.
A multi-label distribution system is a tuple S = ( X , Y ) S=(\mathbf{X},\mathbf{Y}) S=(X,Y) where X = [ x i j ] n × m ∈ R n × m \mathbf{X}=[x_{ij}]_{n\times m}\in\mathbb{R}^{n\times m} X=[xij]n×m∈Rn×m is the data matrix, Y \mathbf{Y} Y is the label array,where Y = [ y i k ] n × l ∈ [ 0 , 1 ] n × l , \mathbf{Y}=[y_{ik}]_{n\times l}\in [0,1]^{n\times l}, Y=[yik]n×l∈[0,1]n×l, and ∑ k = 1 l y i k = 1 \sum_{k=1}^ly_{ik}=1 ∑k=1lyik=1, n n n is the number of instances, m m m is the number of features, and l l l is the number of labels.
作业2
找一篇你们小组的论文来详细分析数学表达式, 包括其涵义, 规范, 优点和缺点.
P ∗ = max P ⊆ X ∑ x k ϕ ∈ P f ( x k ϕ , L ) s . t . ∣ P ∣ = m \mathcal{P}_*=\max_{{\mathcal{P}}\subseteq \mathcal{X}} \sum_{x_k^\phi \in \mathcal{P}}f(x_k^\phi,\mathbf{L}) \space \space \space \space \space s.t.|\mathcal{P}|=m P∗=P⊆Xmaxxkϕ∈P∑f(xkϕ,L) s.t.∣P∣=m
X
\mathcal{X}
X 实例空间
P
\mathcal{P}
P 判别实例池
P
∗
\mathcal{P}_*
P∗ 最优判别实例池
f
(
x
k
ϕ
,
L
)
f(x_k^\phi,\mathbf{L})
f(xkϕ,L) 计算每一个实例的得分
∣
P
∣
|\mathcal{P}|
∣P∣ 实例池的基数
表达式涵义:计算每个实例池中每一个实例得分之和,并选择实例得分之和最高的实例池作为最优判别实例池,其中每个实例池的大小为m。