数据挖掘大学练习题

数据挖掘中北大学练习题

第一章 绪论
一.判断题(共10题,83.0分)
下面各项是否是数据挖掘任务?
1根据性别划分公司的顾客
我的答案:× 得分: 8.3分正确答案:× 答案解析: 这属于简单的数据库查询
2根据可盈利性划分公司的顾客
我的答案:× 得分: 8.3分正确答案:× 答案解析: 这是简单的会计计算
3计算公司的总销售额
我的答案:× 得分: 8.3分正确答案:× 答案解析: 这是简单的会计计算
4按学生的标识号对学生数据库进行排序
我的答案:× 得分: 8.3分正确答案:× 答案解析: 这是简单的数据库查询
5 预测掷骰子的结果
我的答案:× 得分: 8.3分正确答案:× 答案解析: 由于每一面都是同等概率,属于概率计算;如果概率是不同等,根据历史数据预测结果则更类似于数据挖掘任务
6 使用历史记录预测某公司未来的股价价格
我的答案:√ 得分: 8.3分正确答案:√ 答案解析: 需要建立模型来预测股票价格,属于数据挖掘领域中的预测模型,可以使用回归来建模,或使用时间序列分析
7 监测病人心率的异常变化
我的答案:√ 得分: 8.3分正确答案:√ 答案解析: 需要建立正常心率行为模型,并预警非正常心率行为。这属于数据挖掘领域的异常检测。若有正常和非正常心率行为样本,则可看作一个分类问题
8 监视地震活动的地震波
我的答案:√ 得分: 8.3分正确答案:√ 答案解析: 需要建立与地震活动相关的不同波形的模型,并预警波形活动。这属于数据挖掘领域的分类问题
9 提取声波的频率
我的答案:× 得分: 8.3分正确答案:× 答案解析: 属于信号处理问题
10 为用户提供电影推荐
我的答案:√ 得分: 8.3分正确答案:√ 答案解析: 典型推荐问题
二.简答题(共2题,17.0分)
1 举例说明数据挖掘、数据分析、机器学习、人工智能的概念以及区别。
正确答案:
数据挖掘是:从海量的业务数据中识别出巨量数据中有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程。数据挖掘受到很多学科领域的影响,其中数据库、机器学习、统计学无疑影响最大。简言之,对数据挖掘而言,数据库提供数据管理技术,机器学习和统计学提供数据分析技术。
数据分析,是指使用适当的统计分析方法(如聚类分析、相关性分析等)对收集来的大量数据进行分析,从中提取有用信息和形成结论,并加以详细研究和概括总结的过程。
机器学习:利用经验(以数据的形式存在)来改善计算机系统自身的性能,是人工智能的核心研究领域之一,也是计算机科学的子领域,同时也是人工智能的一个分支和实现方式。同时给出了形式化的描述:对于某类任务T和性能度量P,如果一个计算机程序在T上以P衡量的性能随着经验E而自我完善,那么就称这个计算机程序在从经验E学习。
人工智能:是使计算机模拟或实现人类的学习行为,以获取新的知识和技能,使之不断改善自身的性能。
区别:我们可以把数据挖掘理解为一种类型的工作,或工作中的某种成分,机器学习是帮助完成这个工作的方法,所以说机器学习和数据库是数据挖掘的两大支撑技术。统计学、数据库和人工智能共同构造了数据挖掘技术的三大支柱,许多成熟的统计方法构成了数据挖掘的核心内容。数据分析是把数据变成信息的工具,数据挖掘是把信息变成认知的工具,如果我们想要从数据中提取一定的规律(即认知)往往需要数据分析和数据挖掘结合使用。从数据分析的角度来看,绝大多数数据挖掘技术都来自机器学习领域,但机器学习研究往往并不把海量数据作为处理对象,因此,数据挖掘要对算法进行改造,使得算法性能和空间占用达到实用的地步。同时,数据挖掘还有自身独特的内容,即关联分析。
我的答案:
一、 概念
数据挖掘:一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程。
数据分析:是指用适当的统计分析方法对收集来的大量数据进行分析࿰

  • 6
    点赞
  • 36
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值