数据挖掘
BY@VCL
这个作者很懒,什么都没留下…
展开
-
并行FP-Growth算法分析
首先是单机情况下的算法其次参考论文《PFP: Parallel FP-Growth for Query Recommendation》原创 2021-04-23 11:19:07 · 247 阅读 · 0 评论 -
关联分析
Apriori算法:核心思想,找频繁项集,然后一个个的去除去寻找关联规则https://blog.csdn.net/qq_36523839/article/details/82191677https://blog.csdn.net/weixin_39220714/article/details/83595519FP-Growth算法:将频繁项集的关系存在数据结构的树中,这样只需...原创 2020-03-05 19:29:29 · 143 阅读 · 0 评论 -
信息熵
信息熵 在信息论中,熵用于表示信源输出的平均信息量的大小,它能提供信号潜在的动态过程的有用信息,其大小是对信号平均不确定性和复杂性的度量。香农(Shannon)信息熵的定义如下:p表示某个事件的概率。信息熵值是对信号不确定度的度量,可以用来估计信号的复杂性,越不确定、越复杂的信号其熵值越大。https://blog.csdn.net/qq_39521554/ar...原创 2019-03-25 09:58:59 · 5619 阅读 · 0 评论 -
R语言做信息熵和近似熵
计算信息熵目前知道两个包可以算信息熵,philentropy和entropyhttps://cran.r-project.org/web/packages/entropy/entropy.pdfhttps://cran.r-project.org/web/packages/entropy/entropy.pdf下载说明书entropy包要输入的是各部分的占比值,可以是没有归一...原创 2019-03-25 20:45:10 · 3965 阅读 · 0 评论 -
R语言 离散小波变化
library(waveslim)fs=128#采样频率#模拟波形 t=seq(1/fs,2,1/fs)#样本数要是2^J S=1.5*sin(2*pi*6*t)+2*sin(2*pi*50*t)+3*sin(2*pi*100*t)d<-dwt(S,, wf="d8",n.levels=3)d$d2<-rep(0,length(d$d2))d$d1<-rep...原创 2019-04-01 10:16:09 · 2100 阅读 · 0 评论 -
聚类算法学习
大概步骤:1.对初始数据做离群点和噪声处理(有些聚类算法可以处理这些点,但是有些不行)2.对高维数据进行降维、标准化、归一化处理3.选择聚类算法,主要是明确自己数据的簇类型(基于密度、原型、图等)1.异常值处理:删除有空值数据2.噪声处理:移动平滑滤波# yy = smooth(y) smooths the data in the column vector y ....原创 2019-06-14 15:30:32 · 136 阅读 · 0 评论