![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
异常值识别
文章平均质量分 78
铖铖的花嫁
但愿日子干净,抬头遇见的都是柔情
展开
-
基于pyod中机器学习与神经网络方法的异常值识别方法合集(含2022年全国服务外包大赛实例)
采取多种算法结合的方法识别异常值,以2022年全国服务外包大赛A03异常商品识别问题为例。主要方法有'PCA''COPOD''Iforest''LODA''CBLOF''HBOS''MCD''FB''KNN''LOF''ABOD''VAE''AutoEncoder'原创 2022-04-22 13:16:58 · 1015 阅读 · 1 评论 -
基于简单的机器学习方法等异常值识别方法(含2022年全国服务外包大赛实例)
采取多种机器学习办法处理异常值识别问题,主要一些思路和简单的解决办法,是探索的流程。以2022年全国大学生服务外包大赛A03异常商品识别为例原创 2022-04-22 13:11:59 · 1963 阅读 · 0 评论 -
多种方法(聚类、衍生变量、多重筛选、损失函数)解决解决异常值识别效果不佳问题(含2022年全国服务外包大赛实例)
我们以2022年全国服务外包大赛的A03题目作为示例。 问题的主要任务时找出商品的销量异常和价格异常,提供4个月的商品信息数据,共1700万余条,4个月的店铺信息数据,共60万余条,强调时间复杂度空间复杂度、异常值识别率和准确率。我们用店铺分析辅助商品的异常,以提高可信度和准确率。 店铺部分数据链接:https://pan.baidu.com/s/1iAp-s2JwG_YTB35BevMNyQ 提取码:jhnb 但是由于数据分布多样,异常店铺往往和奢侈品店铺以及火爆店铺同时出现,大大降低了我原创 2022-04-22 13:09:29 · 2108 阅读 · 6 评论 -
基于自动机器学习工具hyperGBM的异常值识别中缺失值填补问题(含2022年全国服务外包大赛实例)
我们以2022年全国服务外包大赛的A03题目作为示例代码演示缺失值填补过程。 主要是提供一种缺失值填补的方案,从预测和分类的角度来解决问题,算是除了经典的随机森林算法之外的其他方法原创 2022-04-22 13:06:38 · 634 阅读 · 0 评论 -
pandas在数据分析(异常值识别问题)中的应用,以衍生特征计算为例(含2022年全国服务外包大赛实例)
主要介绍pandas的应用,运用自然语言处理(NLP)的一些小知识和综合评价部分的知识,结合2022年全国大学生服务外包大赛A03赛题异常商品识别讲解,还有自己构建衍生特征的一些思路和想法。原创 2022-04-22 13:01:37 · 1399 阅读 · 0 评论 -
数据分析问题(异常值识别)中数据预处理部分流程(含2022年全国服务外包大赛实例)
博主个人理解的数据预处理主要包括 个方面:读取文件 => 数据概览 => 缺失值填补 => 数据分布预览 => 衍生特征设计。这套流程在完成异常值识别时作为数据预处理时没有什么问题的。 我们以2022年全国服务外包大赛的A03题目作为示例代码实现整个预处理过程。问题的主要任务时找出商品的销量异常和价格异常,提供4个月的商品信息数据,共1700万余条,4个月的店铺信息数据,共60万余条,强调时间复杂度空间复杂度、异常值识别率和准确率。 部分数据:链接:https://pan原创 2022-04-22 12:58:56 · 2067 阅读 · 0 评论