一、 填空与选择填空(本题答案写在此试卷上,30分)
1、模式识别系统的基本构成单元包括: 模式采集 、 特征提取与选择
和 模式分类 。
2、统计模式识别中描述模式的方法一般使用 特真矢量 ;句法模式识别中模式描述方法一般有 串 、 树 、 网 。
3、聚类分析算法属于 (1) ;判别域代数界面方程法属于 (3) 。
(1)无监督分类 (2)有监督分类 (3)统计模式识别方法(4)句法模式识别方法
4、若描述模式的特征量为0-1二值特征量,则一般采用 (4) 进行相似性度量。
(1)距离测度 (2)模糊测度 (3)相似测度 (4)匹配测度
5、 下列函数可以作为聚类分析中的准则函数的有 (1)(3)(4) 。
(1)
(2) (3) (4)
6、Fisher线性判别函数的求解过程是将N维特征矢量投影在 (2) 中进行 。
(1)二维空间 (2)一维空间 (3)N-1维空间
7、下列判别域界面方程法中只适用于线性可分情况的算法有 (1) ;线性可分、不可分都适用的有
(3) 。
(1)感知器算法 (2)H-K算法 (3)积累位势函数法
8、下列四元组中满足文法定义的有 (1)(2)(4) 。
(1)({A, B}, {0, 1}, {A?01, A ? 0A1 , A ? 1A0 , B ? BA , B ? 0}, A)
(2)({A}, {0, 1}, {A?0, A ? 0A}, A)
(3)({S}, {a, b}, {S ? 00S, S ? 11S, S ? 00, S ? 11}, S)
(4)({A}, {0, 1}, {A?01, A ? 0A1, A ? 1A0}, A)
9、影响层次聚类算法结果的主要因素有( 计算模式距离的测度、(聚类准则、类间距离门限、预定的类别数目))。
10、欧式距离具有( 1、2 );马式距离具有( 1、2、3、4 )。
(1)平移不变性(2)旋转不变性(3)尺度缩放不变性(4)不受量纲影响的特性
11、线性判别函数的正负和数值大小的几何意义是(正(负)表示样本点位于判别界面法向量指向的正(负)半空间中;绝对值正比于样本点到判别界面的距离。)。
12、感知器算法 1 。
(1)只适用于线性可分的情况;(2)线性可分、不可分都适用。
13、积累势函数法较之于H-K算法的优点是(该方法可用于非线性可分情况(也可用于线性可分情况) );
K(x)?
位势函数K(x,xk)与积累位势函数K(x)的关系为(?~xk?X????kK(x,xk))。
14、在统计模式分类问题中,聂曼-皮尔逊判决准则主要用于( 某一种判决错误较另一种判决错误更为重要)情况;最小最大判决准则主要用于( 先验概率未知的)情况。
15、“特征个数越多越有利于分类”这种说法正确吗?( 错误 )。特征选择的主要目的是(从n个特征
中选出最有利于分类的的m个特征(m>n )的条件下,可以使用分支定界法以减少计算量。
16、 散度Jij越大,说明?i类模式与?j类模式的分布(差别越大);当?i类模式与?j类模式的分
布相同时,Jij=(0)。
17、 已知有限状态自动机Af=(?,Q,?,q0,F),?={0,1};Q={q0,q1};?:?(q0,0)= q1,?(q0,
1)= q1,?(q1,0)=q0,?(q1,1)=q0;q0=q0;F={q0}。现有输入字符串:(a) 00011101011,(b) 1100110011,(c) 101100111000,(d)0010011,试问,用Af对上述字符串进行分类的结果为( ω1:{a,d};ω2:{b,c} )。
18、影响聚类算法结果的主要因素有( ②③④ )。
①已知类别的样本质量;②分类准则;③特征选取;④模式相似性测度。
19、模式识别中,马式距离较之于欧式距离的优点是( ③④ )。
①平移不变性;②旋转不变性;③尺度不变性;④考虑了模式的分布。
20、基于二次准则函数的H-K算法较之于感知器算法的优点是( ①③ )。
①可以判别问题是否线性可分;②其解完全适用于非线性可分的情况;
③其解的适应性更好;④计算量小。
21、影响基本C均值算法的主要因素有( ④①② )。
①样本输入顺序;②模式相似性测度;③聚类准则;④初始类心的选取。
22、位势函数法的积累势函数K(x)的作用相当于Bayes判决中的( ②④ )。
①先验概率;②后验概率;③类概率密度;④类概率密度与先验概率的乘积。
23、在统计模式分类问题中,当先验概率未知时,可以使用( ②④ )。