- 博客(11)
- 收藏
- 关注
原创 使用绝对中位差算法(MAD)找出数据中的离群值
MAD算法的基本思想是:对于一组数据,如果有一个或几个异常值,那么中位数能够更好地代表这组数据的“中心”位置。因此,通过计算每个数据点与中位数的绝对差值,可以找到可能的异常值。在这种情况下,可以使用其他的稳健估计方法,如中位数绝对偏差(MAD)的稳健版本(Robust MAD),或者使用其他的异常值检测方法,如z-score方法等。绝对中位差(MAD,Median Absolute Deviation)算法是一种用于稳健估计数据分布的方法,特别是对于含有异常值的数据分布。
2023-12-06 10:51:57
1323
原创 LOF模型(异常检测)使用基于密度的局部异常因子算法(LOF)找出数据中的异常值
LOF模型(Local Outlier Factor)是一种异常检测算法,它衡量给定样本的密度的局部偏差相对于其邻居。该模型通过比较每个点与它的邻域点的密度来判断该点是否为异常点。如果点p的密度越低,则认为它越可能是异常点。其中,密度是通过点之间的距离来计算的,距离越近,密度越高。LOF模型具有较高的检测精度,但它的时间复杂度较高,且适用于局部区域空间问题,对于完整区域空间问题,KNN和Iforest等方法可。
2023-12-06 10:28:07
727
原创 第08、09次课 深度学习DNN
https://wq1myhtg4r.feishu.cn/docs/doccncxoc76VTgpfIWkb7T9Ntsh#
2023-08-30 16:37:07
32
原创 第07次课 多分类Softmax
https://wq1myhtg4r.feishu.cn/docs/doccngBatL9n3u0mDNudHzmS7tX
2023-08-28 11:24:19
33
原创 加餐课 Hadoop&MapReduce
https://wq1myhtg4r.feishu.cn/docs/doccn2YPRVB0gsKWxsfKfy7rmDb
2023-08-19 22:41:04
38
原创 第04次课 传统机器学习&朴素贝叶斯
https://wq1myhtg4r.feishu.cn/docs/doccn7LDtE7jAav9WV1fOjPwreh#
2023-08-18 16:53:25
27
原创 人工智能 第02次课 Python基础&文本处理
Count Vector方法只考虑了TF,很片面!由此引出TF*IDF方法(2)小案例:计算两个字符串的相似度。
2023-08-11 15:10:06
45
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人