数据挖掘原理
文章平均质量分 80
使用 Weka 软件实现数据挖掘原理课程部分实验,共四个实验。
lazyn
lazy zyn,so lazyn
展开
-
《数据挖掘基础》习题七
3.简述Web数据挖掘的意义。通过Web数据挖掘,我们可以从数以亿计储存着大量多种多样信息的Web页面及其链接和用户对页面的访问中挖掘出我们需要的有用知识,具体如下:1.从大量的信息中发现用户感兴趣的信息;2.将Web上的丰富信息转变成有用的知识;3.对用户进行信息个性化。9.Web挖掘的数据来源有哪些?1.服务器日志数据...原创 2022-07-13 21:37:28 · 475 阅读 · 0 评论 -
《数据挖掘基础》习题六
(1)Sequential Mining是序列挖掘,序列挖掘是指从序列数据库中发现蕴含的序列模式,一般是指相对时间或者其他顺序出现的序列的高频率子序列的发现,典型的应用还是限于离散性序列。(2)Time series指时间序列,从统计意义上来讲,时间序列就是将某一个指标在不同时间上的不同数值,按照时间的先后顺序排列而成的数列。前后时刻的数值或数据点的相关性往往呈现某种趋势性或周期性变化。(3)Offset Translation指偏移变换,两个序列做相应的偏移变换与幅度缩放可以得出两个序列具有很强的相似原创 2022-07-13 17:05:09 · 749 阅读 · 0 评论 -
《数据挖掘基础》习题五
2.简单地描述下列英文缩写的含义。(1)PAM(2)STING(3)DBSCAN(1)PAM(Partitioning Around Medoid),围绕中心点的划分)是最早提出的k-中心点算法之一,是聚类分析算法中划分法的一个聚类方法,它选用簇中位置最中心的对象作为代表对象,试图对n个对象给出k个划分。(2)STING(Statistical Information Grid_based Method)是一种基于网格的多分辨率聚类技术,他将空间区域划分为矩形单元。针对不同级别的分辨率,通常存在多个级原创 2022-07-13 01:04:33 · 6572 阅读 · 0 评论 -
《数据挖掘基础》习题四
4.简述基于距离的分类算法的主要思想。基于距离的分类算法的思路为:假定数据库中的每个元组ti为数值向量,每个类用一个典型数值向量来表示,则能通过分配每个元祖到它最相似的类来实现分类。26如何评价分类器的性能?分类器的性能和所选择的测试集和训练集有直接的关系,一般情况下,先用一部分数据建立模型,然后再用剩下的数据来测试和验证这个得到的模型。如果使用相同的训练和测试集,那么模型的准确度就很难使人信服。保持法和交叉验证是两种基于给定数据随机选样划分的、常用的评估分类方法准确率的技术。...原创 2022-07-12 22:53:49 · 4103 阅读 · 5 评论 -
《数据挖掘基础》习题二
3.简述在数据挖掘前要进行数据预处理的理由及其解决的主要问题。数据预处理是KDD的重要阶段,而且花费可能很大。有一种“3:7”的说法,就是指数据抽取和预处理工作一般可能占到整个KDD过程的70%,在开始一个知识发现项目之前必须清晰地定义挖掘目标,而盲目性地挖掘是没有任何意义的。数据预处理主要对前一阶段抽取的数据进行再加工,检查数据的完整性及数据的一致性,包括消除噪声、推导计算缺值数据、消除重复记录、完成数据类型转换(如把连续值型数据转换为离散型的数据,以便于符号归纳,或是把离散型的转换为连续值型的。..原创 2022-07-12 22:12:08 · 1825 阅读 · 0 评论 -
《数据挖掘基础》习题一
7. 数据(data)、信息(information)和知识(knowledge)是人们认识和利用数据的三个不同阶段,数据挖掘技术是如何把它们有机的结合在一起的?数据是形成知识的源泉,不断的利用知识来获得信息,具体表现如下:客观世界—(收集)—》数据—(分析)—》信息—(深入分析)—》知识—(决策与行动)—》客观世界。11. 你认为应该如何来理解KDD和Data mining的关系?说明理由?在某些时候可以认为Data mining就是KDD,KDD在人工智能界更流行。...原创 2022-07-12 20:47:54 · 2509 阅读 · 0 评论 -
《数据挖掘基础》实验:Weka平台实现聚类算法
Weka平台实现聚类算法进一步理解聚类算法(K-平均、PAM、层次聚类、密度聚类),利用weka实现数据集的聚类处理,学会调整模型参数,以图或树的形式给出挖掘结果,并解释规则的含义。原创 2021-12-21 18:26:25 · 10473 阅读 · 0 评论 -
《数据挖掘基础》实验:Weka平台实现分类算法
Weka平台实现分类算法进一步理解分类算法(决策树、贝叶斯),利用weka实现数据集的分类处理,学会调整模型参数,以图或树的形式给出挖掘结果,并解释规则的含义。原创 2021-12-21 15:05:12 · 10976 阅读 · 1 评论 -
《数据挖掘基础》实验:Weka平台实现关联规则挖掘
Weka平台实现关联规则挖掘:进一步理解关联规则算法(Apriori算法、FP-tree算法),利用weka实现数据集的挖掘处理,学会调整模型参数,读懂挖掘规则,解释规则的含义原创 2021-12-21 10:42:36 · 15853 阅读 · 4 评论 -
《数据挖掘基础》实验:Weka环境基本操作
实现Weka环境基本操作,包括1. Explorer界面的各项功能2. 文件导入与编辑3. 数据预处理原创 2021-12-20 23:04:53 · 10696 阅读 · 2 评论