1.需要抓住数据挖掘任务两大类任务以及四种主要数据挖掘任务的特点:预测任务、相关分析、聚类分析、异常检测。
(a)并不是数据挖掘任务,只是简单的数据库查询工作。
(b)设定一定阈值的会计计算,不是数据挖掘。如果是预测盈利就可以是数据挖掘
(c)简单数值计算
(d)数据库查询
(e)由于骰子的出现的概率均等,这是概率计算问题,解决问题的方法已经由之前的数学家得出了
(f)是的,预测任务
(g) 异常检测,研究需要建立一个正常跳动时的心脏心率模型,如果出现异常时便可提示警告
也可以认为是分类任务,正常与非正常时的心率表现。
(h)与g题是一样的道理,检测异常。
(i)信号处理过程,不是数据挖掘任务。
2.聚类可帮助公司对于刻画多种用户类型,
分类可以预测用户对不同话题的感兴趣是否感兴趣,
关联数据挖掘可以发现一些特定的查询是否有很大的概率紧随其他查询,允许高效率缓存。
异常检测可以发现不同寻找的用户使用模式,发现突然流行的一个话题。
3.(a ) 公共数据,不具有私有性
(b)个人隐私问题
(c) NASA会共享这些数据,不具有私有性
(d) 印成册 证明被大家所认可了,不具有私有性
(e) 这个界限比较模糊,但是一般现在大家愿意共享自己的电子邮件。