机器学习-专项训练

 

准确率是检索出相关文档数与检索出的文档总数的比率,衡量的是检索系统的查准率

召回率是指检索出的相关文档数和文档库中所有的相关文档数的比率,衡量的是检索系统的查全率

为了解决准确率和召回率冲突问题,引入了F1分数

 

   

 

   位势函数法的积累势函数K(x)的作用相当于Bayes判决中的()

   类概率密度与先验概率的乘积

 

   从使用的主要技术上看,可以把分类方法归结为哪几种类型 

规则归纳方法

贝叶斯分类方法

决策树分类方法

基于距离的分类方法

  统计模式分类问题中,当先验概率未知时,可以使用()

最小最大损失准则

N-P判决

在机器学习中,下列关于各算法对应的损失函数正确的是(      )

最小二乘-Square loss

SVM-Hinge Loss

Logistic Regression-(log-Loss)

AdaBoost-指数损失函数

 下列层次聚类算法中,哪些更适合处理大数据?(      )

CURE算法

ROCK算法

Chameleon算法

BIRCH算法

SPSS中,数据整理的功能主要集中在( )等菜单中

数据

分析

类别不平衡(class-imbanlance)就是指分类问题中不同类别的训练样本相差悬殊的情况,例如正例有900个,而反例只有100个,这个时候我们就需要进行相应的处理来平衡这个问题,下列方法正确的是(      )

在训练样本较多的类别中进行欠采样

直接基于原数据集进行学习,对预测值进行再缩放处理

通过对反例中的数据进行插值,来产生额外的反例

印度电影《宝莱坞机器人之恋》中的机器人七弟采用的智能算法最有可能是以下哪一种()

神经网络

以下哪些算法不能用于路径规划 (       )

K-Mean

有两个样本点,第一个点为正样本,它的特征向量是(0,-1);第二个点为负样本,它的特征向量是(2,3),从这两个样本点组成的训练集构建一个线性SVM分类器的分类面方程是()

x+2y=3

点到面的距离

下列关于线性回归说法错误的是()

在现有模型上,加入新的变量,所得到的R^2的值总会增加

以下哪些学科和数据挖掘有密切联系()

统计

人工智能

关于K-means聚类算法说法正确的是()

对大数据集有较高的效率并且具有可伸缩性。

是一种无监督学习方法。

k值无法自动获取,初始聚类中心随机选择。

以下()属于线性分类器最佳准则?

感知准则函数

支持向量机

Fisher准则

 

以下说法正确的是()

每次使用K-means算法得到的聚类结果可能会不一样

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值