质量估计及其应用(Mass Estimation and Its Applications)
吐槽
今天研究下这篇文章,这个文章和前面的IForest有着非常紧密的关系。先占个坑,中午2点前将这文章更完。然并卵,现在已经是第二天的上午了。。拖延症又犯了
数据质量(data mass)
什么是数据质量呢?数据质量是指一个区域内数据点的数目。假设数据集X是分布在
相比数据密度,数据质量有以下三方面的优势:
1.数据质量计算量小,只是统计一个区域内数据的数量,而不像数据密度一样计算点和点之间的距离。
2.数据质量能够给出一个数据云中,每个数据点一个排序,这个排序能够反映数据点是靠近数据云中心还是边缘。
数据质量估计
这里只考虑一维数据的质量估计。
Level-1质量估计
假设一个数据序列
本文介绍了数据质量的概念及其与数据密度的区别,详细解释了一种新的数据质量度量方法——质量估计,并探讨了其在离群点检测等领域的应用前景。

被折叠的 条评论
为什么被折叠?



