1 邻域粗糙集的基础知识
设
Ω
Ω
Ω 是
N
N
N 维实值空间,
S
=
R
N
×
R
N
→
R
S=R^{N} \times R^{N} \rightarrow R
S=RN×RN→R,
S
S
S 被称作是
R
N
R^{N}
RN 上的一个测度,如果满足以下条件:
(1)
S
(
x
1
,
x
2
)
≥
0
,
S
(
x
1
,
x
2
)
=
0
,
当且仅当
x
1
=
x
2
,
∀
x
1
,
x
2
∈
R
N
S\left(x_{1}, x_{2}\right) \geq 0, \quad S\left(x_{1}, x_{2}\right)=0, 当且仅当 x_{1}=x_{2}, \quad \forall x_{1}, x_{2} \in R^{N}
S(x1,x2)≥0,S(x1,x2)=0,当且仅当x1=x2,∀x1,x2∈RN;
(2)
S
(
x
1
,
x
2
)
=
S
(
x
2
,
x
1
)
,
∀
x
1
,
x
2
∈
R
N
S\left(x_{1}, x_{2}\right)=S\left(x_{2}, x_{1}\right), \quad \forall x_{1}, x_{2} \in R^{N}
S(x1,x2)=S(x2,x1),∀x1,x2∈RN;
(3)
S
(
x
1
,
x
3
)
≤
S
(
x
1
,
x
2
)
+
S
(
x
2
,
x
3
)
,
∀
x
1
,
x
2
,
x
3
∈
R
N
S\left(x_{1}, x_{3}\right) \leq S\left(x_{1}, x_{2}\right)+S\left(x_{2}, x_{3}\right), \quad \forall x_{1}, x_{2}, x_{3} \in R^{N}
S(x1,x3)≤S(x1,x2)+S(x2,x3),∀x1,x2,x3∈RN.
S
S
S 通常用作实数空间上的 Minkowski 距离函数:
S
(
x
i
,
x
j
)
=
[
∑
k
=
1
N
∣
x
i
k
−
x
j
k
∣
p
]
1
/
p
S\left(x_{i}, x_{j}\right)=\left[\sum_{k=1}^{N}\left|x_{i k}-x_{j k}\right|^{p}\right]^{1 / p}
S(xi,xj)=[∑k=1N∣xik−xjk∣p]1/p.
定义 1.1 给定信息系统 < U , A , V , f > <U, A, V, f> <U,A,V,f>, 其中 U = { x 1 , x 2 , ⋯ , x n } U=\left\{x_{1}, x_{2}, \cdots, x_{n}\right\} U={x1,x2,⋯,xn} 是一组论域的有限集, A A A 是一组非空数值型条件属性, V V V 是所有属性的取值范围, f f f 表示一个映射: U × A → V U \times A \rightarrow V U×A→V.
定义 1.2 给定信息系统 < U , A , V , f > , B ⊆ A <U, A, V, f>, \quad B \subseteq A <U,A,V,f>,B⊆A,邻域关系 R B δ R_{B}^{\delta} RBδ 定义如下: R B δ = { ( x , y ) ∈ U × U : ∣ f l ( x ) − f l ( y ) ∣ ≤ δ , a l ∈ B } . R_{B}^{\delta}=\left\{(x, y) \in U \times U:\left|f_{l}(x)-f_{l}(y)\right| \leq \delta, a_{l} \in B\right\}. RBδ={(x,y)∈U×U:∣fl(x)−fl(y)∣≤δ,al∈B}. 这里 δ \delta δ 是用户事先指定的非负常数。
定义 1.3 给定信息系统 < U , A , V , f > , B ⊆ A <U, A, V, f>, \quad B \subseteq A <U,A,V,f>,B⊆A,对于任意 x ∈ U x \in U x∈U,邻域类 [ x ] B δ [x]_{B}^{\delta} [x]Bδ 定义如下: [ x ] B δ = { y ∈ U : ( x , y ) ∈ R B δ } . [x]_{B}^{\delta}=\left\{y \in U:(x, y) \in R_{B}^{\delta}\right\}. [x]Bδ={y∈U:(x,y)∈RBδ}.
定义 1.4 设 U = { x 1 , x 2 , ⋯ , x n } U=\left\{x_{1}, x_{2}, \cdots, x_{n}\right\} U={x1,x2,⋯,xn} 是对象集, A = { a 1 , a 2 , ⋯ , a m } A=\left\{a_{1}, a_{2}, \cdots, a_{m}\right\} A={a1,a2,⋯,am} 是一组非空数值型条件属集, B ⊆ A , R B δ B \subseteq A, \quad R_{B}^{\delta} B⊆A,RBδ 是由 B B B 诱导的邻域关系, 对于任意 X ⊆ U , X X \subseteq U, X X⊆U,X 的下近似和上近似定义如下: R ‾ B δ ( X ) = { x ∈ U : [ x ] B δ ⊆ X } , R ˉ B δ ( X ) = { x ∈ U : [ x ] B δ ∩ X ≠ ∅ } . \underline{R}_{B}^{\delta}(X)=\left\{x \in U:[x]_{B}^{\delta} \subseteq X\right\}, \quad \bar{R}_{B}^{\delta}(X)=\left\{x \in U:[x]_{B}^{\delta} \cap X \neq \varnothing\right\}. RBδ(X)={x∈U:[x]Bδ⊆X},RˉBδ(X)={x∈U:[x]Bδ∩X=∅}.
定义 1.5 给定决策信息系统 < U , A , D > . <U, A, D>. <U,A,D>. 其中, U = { x 1 , x 2 , ⋯ , x n } U=\left\{x_{1}, x_{2}, \cdots, x_{n}\right\} U={x1,x2,⋯,xn} 是一组有限对象集, A = { a 1 , a 2 , ⋯ , a m } A=\left\{a_{1}, a_{2}, \cdots, a_{m}\right\} A={a1,a2,⋯,am} 是一组非空数值型条件属性集,对象集 U U U 被决策 D D D 划分成 r r r 个分明的决策类,即: U / D = { E 1 , E 2 , ⋯ , E r } U / D=\left\{E_{1}, E_{2}, \cdots, E_{r}\right\} U/D={E1,E2,⋯,Er}.
定义 1.6 给定决策表 ( U , A , D ) , B ⊆ A , U / D = { E 1 , E 2 , ⋯ , E r } , R B δ (U, A, D), B \subseteq A, U / D=\left\{E_{1}, E_{2}, \cdots, E_{r}\right\}, R_{B}^{\delta} (U,A,D),B⊆A,U/D={E1,E2,⋯,Er},RBδ 是由 B B B 诱导的 U U U 上的邻域关系,关于条件属性子集 B , D B, \quad D B,D 的下近似和上近似定义如下: R ‾ B δ ( D ) = ⋃ k = 1 r R ‾ B δ ( E k ) , R ˉ B δ ( D ) = ⋃ k = 1 r R ˉ B δ ( E k ) . \underline{R}_{B}^{\delta}(D)=\bigcup_{k=1}^{r} \underline{R}_{B}^{\delta}\left(E_{k}\right), \quad \bar{R}_{B}^{\delta}(D)=\bigcup_{k=1}^{r} \bar{R}_{B}^{\delta}\left(E_{k}\right). RBδ(D)=k=1⋃rRBδ(Ek),RˉBδ(D)=k=1⋃rRˉBδ(Ek).其中, R ‾ B δ ( E k ) = { x i ∣ [ x i ] B δ ⊆ E k , x i ∈ U } , R ˉ B δ ( E k ) = { x i ∣ [ x i ] B δ ∩ E k ≠ ∅ , x i ∈ U } . \underline{R}_{B}^{\delta}\left(E_{k}\right)=\left\{x_{i} \mid\left[x_{i}\right]_{B}^{\delta} \subseteq E_{k}, x_{i} \in U\right\}, \quad \bar{R}_{B}^{\delta}\left(E_{k}\right)=\left\{x_{i} \mid\left[x_{i}\right]_{B}^{\delta} \cap E_{k} \neq \varnothing, x_{i} \in U\right\}. RBδ(Ek)={xi∣[xi]Bδ⊆Ek,xi∈U},RˉBδ(Ek)={xi∣[xi]Bδ∩Ek=∅,xi∈U}.
定义 1.7 给定决策表 ( U , A , D ) , B ⊆ A , U / D = { E 1 , E 2 , ⋯ , E r } , R B δ (U, A, D), B \subseteq A, U / D=\left\{E_{1}, E_{2}, \cdots, E_{r}\right\}, R_{B}^{\delta} (U,A,D),B⊆A,U/D={E1,E2,⋯,Er},RBδ 是由 B B B 诱导的 U U U 上的邻域关系,决策系统正域定义如下: P O S B δ ( D ) = ⋃ E k ∈ U / Y R ‾ B δ ( E k ) . P O S_{B}^{\delta}(D)=\bigcup_{E_{k} \in U / Y} \underline{R}_{B}^{\delta}\left(E_{k}\right). POSBδ(D)=Ek∈U/Y⋃RBδ(Ek).
定义 1.8 给定决策表
(
U
,
A
,
D
)
,
B
⊆
A
,
U
/
D
=
{
E
1
,
E
2
,
⋯
,
E
r
}
,
R
B
δ
(U, A, D), B \subseteq A, U / D=\left\{E_{1}, E_{2}, \cdots, E_{r}\right\}, R_{B}^{\delta}
(U,A,D),B⊆A,U/D={E1,E2,⋯,Er},RBδ 是由
B
B
B 诱导的
U
U
U 上的邻域关系。关于条件属性子集
B
B
B,决策属性
D
D
D 的依赖度定义如下:
γ
B
δ
(
D
)
=
∣
P
O
S
B
δ
(
D
)
∣
∣
U
∣
.
\gamma_{B}^{\delta}(D)=\frac{\left|P O S_{B}^{\delta}(D)\right|}{|U|}.
γBδ(D)=∣U∣
POSBδ(D)
.
定义 1.8 通常被用作邻域粗糙集模型中特征选择经典的依赖函数。然而,这种依赖函数的缺点在于它的构建仅考虑正域中样本与论域样本的数量比。换句话说, 只有部分样本参与计算决策依赖度。实际上, 决策的上近似样本集也提供了一些不容忽视的信息, 这些信息也应参与决策依赖度的计算。
2 模糊粗糙集的基础知识
定义 2.1 设 U U U 是一个样本空间,通常称之为论域。存在一个映射 A ( ⋅ ) A(\cdot) A(⋅) 将论域映射在 [ 0 , 1 ] [0,1] [0,1],即: A ( ⋅ ) : U → [ 0 , 1 ] A(\cdot): U \rightarrow[0,1] A(⋅):U→[0,1]. 则 A A A 被称为 U U U 上的一个模糊集。对于任意 x ∈ U x \in U x∈U, A ( x ) A(x) A(x) 表示 x x x 到 A A A 的隶属程度。 U U U 上的所有模糊集族被称为模糊幂集, 记为: F ( U ) F(U) F(U). 则模糊隶属度函数的值域在 [ 0 , 1 ] [0,1] [0,1], 即: 0 ≤ A ( x ) ≤ 1 0 \leq A(x) \leq 1 0≤A(x)≤1. 显然, 分明集是特殊的模糊集。
定义 2.2 给定样本空间
U
=
{
x
1
,
x
2
,
⋯
,
x
n
}
,
A
U=\left\{x_{1}, x_{2}, \cdots, x_{n}\right\}, A
U={x1,x2,⋯,xn},A 是用数值型属性值描述样本的属性集合,
R
A
R_{A}
RA 是由数值型属性诱导的
U
U
U 上的一个模糊二元关系,称
R
A
R_{A}
RA 是一个模糊相似关系,如果
R
A
R_{A}
RA 满足:
(1) 满足自反性:
R
A
(
x
,
x
)
=
1
\quad R_{A}(x, x)=1
RA(x,x)=1, 对于任意
x
∈
U
x \in U
x∈U;
(2) 满足对称性:
R
A
(
x
,
y
)
=
R
A
(
y
,
x
)
\quad R_{A}(x, y)=R_{A}(y, x)
RA(x,y)=RA(y,x), 对于任意
x
,
y
∈
U
x, y \in U
x,y∈U.
定义 2.3 对于任意 x ∈ U , x x \in U, x x∈U,x 关于 R A R_{A} RA 的模糊相似类定义如下: [ x ] A ( y ) = R A ( x , y ) , y ∈ U . [x]_{A}(y)=R_{A}(x, y), \quad y \in U. [x]A(y)=RA(x,y),y∈U. 显然, 它是 U U U 上的一个模糊集。当模糊相似关系退化为分明关系时, 模糊邻域也退化为分明的邻域。
定义 2.4 给定样本空间
U
=
{
x
1
,
x
2
,
⋯
,
x
n
}
,
A
=
{
a
1
,
a
2
,
⋯
,
a
m
}
U=\left\{x_{1}, x_{2}, \cdots, x_{n}\right\}, A=\left\{a_{1}, a_{2}, \cdots, a_{m}\right\}
U={x1,x2,⋯,xn},A={a1,a2,⋯,am} 是一个实值属性集,
B
⊆
A
,
R
B
B \subseteq A, R_{B}
B⊆A,RB 是由
B
B
B 诱导的
U
U
U 上的一个模糊相似关系,对于任意模糊集合
X
∈
F
(
U
)
X \in F(U)
X∈F(U),
X
X
X 的模糊下近似、上近似定义如下:
R
‾
B
(
X
)
(
x
)
=
inf
y
∈
U
max
{
1
−
R
B
(
x
,
y
)
,
X
(
y
)
}
,
x
∈
U
.
R
B
‾
(
X
)
(
x
)
=
max
y
∈
U
inf
{
R
B
(
x
,
y
)
,
X
(
y
)
}
,
x
∈
U
.
\begin{gathered} \underline{R}_{B}(X)(x)=\inf _{y \in U} \max \left\{1-R_{B}(x, y), X(y)\right\}, \quad x \in U. \\ \overline{R_{B}}(X)(x)=\max _{y \in U} \inf \left\{R_{B}(x, y), X(y)\right\}, \quad x \in U. \end{gathered}
RB(X)(x)=y∈Uinfmax{1−RB(x,y),X(y)},x∈U.RB(X)(x)=y∈Umaxinf{RB(x,y),X(y)},x∈U.
定义 2.5 给定样本空间 U = { x 1 , x 2 , ⋯ , x n } , A = { a 1 , a 2 , ⋯ , a m } U=\left\{x_{1}, x_{2}, \cdots, x_{n}\right\}, A=\left\{a_{1}, a_{2}, \cdots, a_{m}\right\} U={x1,x2,⋯,xn},A={a1,a2,⋯,am} 是一个实值属性 集, D D D 是一个决策属性,样本集 U U U 被 D D D 划分成 r r r 个分明的等价类, 即: U / D = { D 1 , D 2 , ⋯ , D r } U / D=\left\{D_{1}, D_{2}, \cdots, D_{r}\right\} U/D={D1,D2,⋯,Dr}, 称 ( U , A , D ) (U, A, D) (U,A,D) 为决策表。
定义 2.6 给定决策表
(
U
,
A
,
D
)
,
B
⊆
A
,
U
/
D
=
{
D
1
,
D
2
,
⋯
,
D
r
}
,
R
B
(U, A, D), B \subseteq A, \quad U / D=\left\{D_{1}, D_{2}, \cdots, D_{r}\right\}, R_{B}
(U,A,D),B⊆A,U/D={D1,D2,⋯,Dr},RB 是 由
B
B
B 诱 导的
U
U
U 上的一个模糊相似关系,决策
D
D
D 关于属性子集
B
B
B 的模糊正域定义如下:
POS
B
(
D
)
(
x
)
=
⋃
i
=
1
r
R
‾
B
(
D
i
)
(
x
)
,
x
∈
U
.
\operatorname{POS}_{B}(D)(x)=\bigcup_{i=1}^{r} \underline{R}_{B}\left(D_{i}\right)(x), \quad x \in U.
POSB(D)(x)=i=1⋃rRB(Di)(x),x∈U. 定义 2.6 表明
x
x
x 分配到确定决策等价类的程度是由
P
O
S
B
(
D
)
(
x
)
POS_{B}(D)(x)
POSB(D)(x) 决定的。
定义 2.7 设
A
A
A 是
U
U
U 上的模糊集,对于任意
α
∈
[
0
,
1
]
\alpha \in[0,1]
α∈[0,1],称
A
α
A_{\alpha}
Aα 是模糊集
A
A
A 的
α
\alpha
α 水平截集,定义如下:
A
α
=
{
x
∈
U
:
A
(
x
)
≥
α
}
.
A_{\alpha}=\{x \in U: A(x) \geq \alpha\}.
Aα={x∈U:A(x)≥α}. 为了表示模糊集的不确定性, 下面引入了一对精度和粗糙度的概念。
定义 2.8 设
(
U
,
R
)
(U, R)
(U,R) 是 Pawlak 近似空间,
α
,
β
∈
[
0
,
1
]
\alpha, \beta \in[0,1]
α,β∈[0,1].
A
A
A 是
U
U
U 上的模糊集,模糊集
A
A
A 的精度和粗糙度定义如下:
α
A
(
α
,
β
)
=
∣
R
‾
(
A
)
α
∣
∣
R
ˉ
(
A
)
β
∣
,
ρ
A
(
α
,
β
)
=
1
−
∣
R
‾
(
A
)
α
∣
∣
R
ˉ
(
A
)
β
∣
.
\alpha_{A}(\alpha, \beta)=\frac{\left|\underline{R}(A)_{\alpha}\right|}{\left|\bar{R}(A)_{\beta}\right|}, \quad \rho_{A}(\alpha, \beta)=1-\frac{\left|\underline{R}(A)_{\alpha}\right|}{\left|\bar{R}(A)_{\beta}\right|}.
αA(α,β)=
Rˉ(A)β
∣R(A)α∣,ρA(α,β)=1−
Rˉ(A)β
∣R(A)α∣. 假设当
R
ˉ
(
A
)
β
=
∅
\bar{R}(A)_{\beta}=\varnothing
Rˉ(A)β=∅ 时,有
ρ
A
(
α
,
β
)
=
0
\rho_{A}(\alpha, \beta)=0
ρA(α,β)=0. 显然,当
0
<
β
≤
α
≤
1
0<\beta \leq \alpha \leq 1
0<β≤α≤1 时,有
0
≤
α
A
(
α
,
β
)
≤
1
0 \leq \alpha_{A}(\alpha, \beta) \leq 1
0≤αA(α,β)≤1,
0
≤
ρ
A
(
α
,
β
)
≤
1
0 \leq \rho_{A}(\alpha, \beta) \leq 1
0≤ρA(α,β)≤1.
模糊集的粗糙度和精度是一对相对概念,用来描述模糊集的粗糙程度。
然而, 定义 2.8 的精度模型存在一个明显的缺点。从截集的定义中,只有一部分样本用于计算模糊集的精度。 因此,定义 2.8 不能准确地反映模糊集的精度。后面将重新定义模糊集的精度和粗糙度, 并引入模糊自信息的概念来度量模糊集的不确定性。
3 小结
一时半会儿是看不懂滴,一步一步来吧!QoMo 和大家一起共同努力学习!共勉!
参考文献
[1]黄洋. 基于自信息测度的特征选择方法研究[D].渤海大学,2019.