1由于K均值聚类是一个迭代过程,我们需要设置其迭代终止条件。下面哪句话正确描述了K均值聚类的迭代终止条件( B )
-
A.已经形成了K个聚类集合,或者已经达到了迭代次数上限
-
B.已经达到了迭代次数上限,或者前后两次迭代中聚类质心基本保持不变
-
C.已经达到了迭代次数上限,或者每个待聚类样本分别归属唯一一个聚类集合
-
D.已经形成了K个聚类集合,或者每个待聚类样本分别归属唯一一个聚类集合
2我们可以从最小化每个类簇的方差这一视角来解释K均值聚类的结果,下面对这一视角描述不正确的是( D )
-
A.每个簇类的方差累加起来最小
-
B.每个样本数据分别归属于与其距离最近的聚类质心所在聚类集合
-
C.最终聚类结果中每个聚类集合中所包含数据呈现出来差异性最小
-
D.每个簇类的质心累加起来最小
3下面哪一句话描述不属于K均值聚类算法的不足( B )
-
A.算法迭代执行
-
B.K均值聚类是无监督聚类
-
C.需要事先确定聚类数目
-
D.需要初始化聚类质心
4下面对数据样本方差解释不正确的是( A )
-
A.方差刻画了样本数据的大小
-
B.方差(样本方差)是每个样本数据与全体样本数据平均值之差的平方和的平均数
-
C.方差描述了样本数据在平均值附近的波动程度
-
D.方差刻画了随机变量或一组数据离散程度
5协方差可以用来计算两个变量之间的相关性,或者说计算两维样本数据中两个维度之间的相关性。基于计算所得的协方差值,可以来判断样本数据中两维变量之间是否存在关联关系。下面哪一个说法是不正确的( D )
-
A.当协方差值大于0 时,则两个变量线性正相关
-
B.当协方差值等于0 时,则两个变量线性不相关
-
C.当协方差值小于0 时,则两个变量线性负相关
-
D.当协方差值等于0 时,则两个变量线性正相关
6皮尔逊相关系数(Pearson Correlation coefficient )可将两组变量之间的关联度规整到一定的取值范围内。下面对皮尔逊相关系数描述不正确的是(C )
-
A.皮尔逊相关系数等于1的充要条件是该两组变量具有线性相关关系
-
B.皮尔逊相关系数的值域是[-1,1]
-
C.皮尔逊相关系数刻画了两组变量之间线性相关程度,如果其取值越大,则两者在线性相关的意义下相关程度越大;如果其值越小,表示两者在线性相关的意义下相关程度越小
-
D.皮尔逊相关系数是对称的
7下面对相关性(correlation)和独立性(independence)描述不正确的是( D )
-
A.独立指两个变量彼此之间不相互影响
-
B.如果两维变量彼此独立,则皮尔逊相关系数等于0
-
C.如果两维变量线性不相关,则皮尔逊相关系数等于0
-
D.“不相关”是一个比“独立”要强的概念,即不相关一定相互独立
8下面对主成分分析的描述不正确的是( C )
-
A.在主成分分析中,将数据向方差最大方向进行投影,可使得数据所蕴含信息没有丢失,以便在后续处理过程中各个数据“彰显个性”
-
B.主成份分析是一种特征降维方法
-
C.在主成分分析中,所得低维数据中每一维度之间具有极大相关度
-
D.主成分分析可保证原始高维样本数据被投影映射后,其方差保持最大
9假设原始数据个数为n,原始数据维数为d,降维后的维数为l,下面对主成分分析算法描述不正确的是( D )
-
A.在主成分分析中,我们将带约束的最优化问题,通过拉格朗日乘子法将其转化为无约束最优化问题
-
B. 主成分分析要学习一个映射矩阵,其大小是d×l
-
C.每个原始数据的维数大小从d变成了l
-
D.主成分分析学习得到了l个d维大小的向量,这l个d维向量之间彼此相关
10下面对特征人脸算法描述不正确的是( D )
-
A.每一个特征人脸的维数与原始人脸图像的维数一样大
-
B.特征人脸方法是用一种称为“特征人脸(eigenface)”的特征向量按照线性组合形式来表达每一张原始人脸图像
-
C.特征人脸方法是一种应用主成分分析来实现人脸图像降维的方法
-
D.特征人脸之间的相关度要尽可能大