机器学习-机器学习概论

1.【单选题】以下有关机器学习理解不正确的是 ( )。

A、查询大量的操作数据去发现新的信息

B、从大量的业务数据中分析有兴趣的新颖知识辅助决策的过程

C、机器学习的结果不一定能辅助决策

D、需要借助统计学或机器学习的一些算法

解:A

机器学习并不是查询大量的操作数据去发现新的信息,而是寻找已有数据中存在的规律。

2.【单选题】移动运营商对客户进行细分,设计套餐和营销活动可以使用下面哪种机器学习方法( )。

A、贝叶斯分类器

B、关联方法

C、聚类算法

D、多层前馈网络

解:C

移动运营商对客户进行细分,设计套餐和营销活动。首先客户是没有标签,我们需要对于没有标签的数据划分成不同的分类,这种机器学习方法属于聚类算法。

3.【单选题】移动运营商对客户的流失进行预测,可以使用下面哪种机器学习方法比较合适 ( )。

A、一元线性回归分析

B、关联方法

C、聚类方法

D、多层前馈网络

解:D

移动运营商对客户的流失进行预测,我们可以将其看成一个分类问题。根据客户的已有信息,例如年龄、收入等等,然后判断他属于流失人员还是不属于流失人员。

一元线性回归分析错在数据特征往往不会是一种。

关联方法是用于发现数据特征之间的联系,通常用于减低数据维度,不能用于分类问题。

聚类方法不能用于解决分类问题。

多层前馈神经网络可以用于解决分类问题。

4.【单选题】数据预处理对机器学习是很重要的,下面说法正确的是( )。

A、数据预处理的效果直接决定了机器学习的结果质量

B、数据噪声对神经网络的训练没什么影响

C、对于有问题的数据都直接删除即可

D、预处理不需要花费大量的时间

解:A

数据预处理的效果直接决定了机器学习的结果质量,正确。因为数据的好坏直接决定了我们从数据中学习到的规则,因此对数据进行预处理是十分必要的。

数据噪声对神经网络的训练具有影响。神经网络中噪声的注入可以有很多种,如输入层,隐层,权重,输出层等。1.输入层注入噪声,其实可以看作是数据集增强的一种手段,本质是一种正则化。原因是神经网络对于噪声并不健壮,只好混入噪声再进行训练,提高鲁棒性。2.输出层注入噪声,其实是对标签噪声建模。

对于有问题的数据,除了直接删除还可以进行平滑处理等操作使其有效。

预处理是机器学习最为关键的一步,数据是机器学习的灵魂。如果数据足够精确,可以尽可能地降低训练难度。

5.【单选题】以下哪个步骤不是机器学习所需的预处理工作( )。

A、数值属性的标准化

B、变量相关性分析

C、异常值分析

D、与用户讨论分析需求

解:D

与用户讨论分析需求不是对数据的预处理,而是明确我们需要完成的任务。

6.【多选题】对于机器学习中的原始数据,存在的问题可能有( )。

A、错误值

B、重复

C、异常值

D、不完整

我的答案:ABCD

数据可能存在错误、重复、异常值、不完整等问题。

  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值