数据挖掘(原理与算法)
文章平均质量分 51
学习并探究其与机器学习等科目的区别与相同
罗辑罗辑
养的胸中一种恬静
展开
-
从全局到局部审视离群点检测(Outlier Detection)
离群点检测(outlier detection)在很多领域都具有广泛的应用。离群点检测算法也各种各样,各种类型各种算法难以计数。我的研究是提出新的离群点检测算法(模型)。离群点检测整体我认为包含有3部分,分别是:数据集,模型,结果。数据集离群点检测所用的数据集一般包含有合成数据集与真实数据集。合成数据集真实数据集真实数据集更加符合实际应用中的情况,用真实数据集将使得算法的结果具有更强的说服力。模型结果...原创 2021-06-15 21:25:38 · 1775 阅读 · 4 评论 -
特征工程:数值特征
机器学习能够处理的特征也就只有数值类型的特征。数值型数据的特征工程技术是非常基本的,只要原始数据被转换成数值型特征,就可以用现有的模型。要对数值型数据进行合理性jiancha原创 2021-06-10 19:01:49 · 329 阅读 · 0 评论 -
PCA的Matlab实现与分析
PCA(Principal Component Analysis)在机器学习领域中,是很常见的一种降维的方法。PCA的主要思想:将原始高维数据集中的点,映射到低维的超平面中,。原创 2021-06-10 12:03:38 · 1373 阅读 · 8 评论 -
投稿之后的思考
离群点检测(outlier detection)在很多领域都具有广泛的应用。离群点检测算法也各种各样,各种类型各种算法难以计数。我的研究是提出新的离群点检测算法(模型)。离群点检测过程ke原创 2021-06-07 19:10:38 · 215 阅读 · 0 评论 -
基于自编码器的离群点检测算法的Matlab版实现
基于自编码器的无监督离群点检测算法的核心思想是:通过将待检测数据集输入自编码器进行训练,训练完成后,那些难以被重构的对象(即重构误差较大的对象)被认为是离群点。基于AE的outlier detection存在的前提,也就是有一个假设条件存在,即:离群点难以被自编码器在输出层重构。基于AE的outlier detection的Matlab版实现如下:function [outputArg1,outputArg2] = GD_AE_OD(inputArg1,inputArg2)%SIMPLEBP原创 2021-01-07 12:18:04 · 848 阅读 · 3 评论 -
基于KNN的离群点检测算法的Matlab版实现
基于KNN的outlier detection是一种很简单高效的离群点检测算法,其核心思想是:通过计算对象与其k个近邻的距离之和作为离群值OF,OF值越高,越有可能是离群点。基于KNN的outlier detection的Matlab版实现:function [outputArg1,outputArg2] = KNN(inputArg1,inputArg2)%KNN 此处显示有关此函数的摘要% 此处显示详细说明x=load('Normalization_wbc.txt');y=load原创 2021-01-07 12:09:39 · 3282 阅读 · 13 评论 -
LOF(local outlier factor)算法的Matlab版本实现
LOF算法是一种基于密度的无监督离群点检测算法,其核心思想是:通过比较对象xi与其邻居密度的相似性程度,如果越不相似,即xi的LOF值越大于1,则其是离群点的可能性越高。下面给出了LOF算法的Matlab版本实现,可直接粘贴复制,并将代码稍作修改即可运行。function [outputArg1,outputArg2] = LOF(inputArg1,inputArg2)x=load ('Normalization_wbc.txt');%装载要检测的数据集Label=load('Label_w原创 2021-01-07 11:51:12 · 7739 阅读 · 65 评论