![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据挖掘
文章平均质量分 92
黄烦烦二号机
这个作者很懒,什么都没留下…
展开
-
数据挖掘实验(二):主成分分析PCA R语言
1.思路2.代码PCA <- function(data,k){ #中心化处理 standardize = data.frame() for(i in 1:nrow(data)){ for(j in 1:ncol(data)){ standardize[i,j] = data[i,j]-mean(data[,j]) } } #协方...原创 2020-01-22 13:41:11 · 152 阅读 · 0 评论 -
数据挖掘实验(六):HTIS 算法 python
一、 实验目的:了解朴素贝叶斯算法基本原理;能够使用朴素贝叶斯算法对数据进行分类编写函数实现示例数据集输出结果。二、 实验语言:Python三、 源代码def initialize_authority(pages): 初始化权限矢量,其中键为 url 且值全部为 1 的字典 return dict(zip(pages.keys(), [1] * len(pages)...原创 2020-01-22 13:54:07 · 231 阅读 · 0 评论 -
数据挖掘实验(五):朴素贝叶斯分类方法 R语言
一、 实验目的:了解朴素贝叶斯算法基本原理;能够使用朴素贝叶斯算法对数据进行分类编写函数实现示例数据集输出结果。二、 实验软件:Rstudio三、 实验思路准备数据data,希望分类的元组X为test主函数 NaiveBayes = function(){}公式 P(Ci|X) = P(X|Ci) P(Ci) / P(X)1.划分C1,C2类,“yes",“no”求P...原创 2020-01-22 13:50:22 · 1676 阅读 · 0 评论 -
数据挖掘实验(九):协同过滤算法 R语言
一、实验目的了解协同过滤算法基本原理;编写代码并实现userCF算法给用户进行物品推荐二、实验内容userCF : 基于用户的推荐基于用户的协同过滤算法主要包括两个步骤。 1. 找到和目标用户兴趣相似的用户集合。 2. 找到这个集合中的用户喜欢的,且目标用户没有听说过的物品推荐给目标用户三、实验代码library(plyr)user<-c(1,1,1,2,2,2,2,3,...原创 2020-01-22 14:15:37 · 307 阅读 · 0 评论 -
数据挖掘实验(七):K-means算法 R语言
一、 实验目的:了解Kmeans算法基本原理;编写代码并实现Kmeans算法对数据的聚簇二、 实验软件Rstudio三、 实验内容(1)K-Means算法K-Means算法是最为经典的基于划分的聚簇方法,是十大经典数据挖掘算法之一。简单的说K-Means就是在没有任何监督信号的情况下将数据分为K份的一种方法。聚类算法就是无监督学习中最常见的一种,给定一组数据,需要聚类算法去挖掘数...原创 2020-01-22 14:05:59 · 1425 阅读 · 0 评论 -
数据挖掘实验(八):DBSCAN聚类 R语言
一、 实验目的了解DBSCAN算法基本原理;编写代码并实现DBSCAN算法对数据的聚簇二、 实验步骤采用的数据集 :R语言factoextra包里的multishapes数据集函数首先确定两个参数:(1)epsilon:在一个点周围邻近区域的半径(2)minPts:邻近区域内至少包含点的个数根据以上两个参数,可以把样本中的点分成三类:核点:满足领域内的点>=min...原创 2020-01-22 13:58:36 · 2273 阅读 · 0 评论 -
数据挖掘实验(四):决策树归纳 R语言
一、 实验目的:决策树分类算法(decision tree)通过树状结构对具有某特征属性的样本进行分类。其典型算法包括ID3算法、C4.5算法、C5.0算法、CART算法等。本次实验掌握用ID3的信息增益来实现决策树归纳。二、 实验软件:Rstudio三、 实验思路1.计算决策属性的熵 Info(D)2.计算每个属性的熵 :计算年龄、收入、学生、信誉的条件熵 Info_A(D)3....原创 2020-01-22 13:46:52 · 1411 阅读 · 0 评论