![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据挖掘
文章平均质量分 66
泡泡怡
越努力,越幸运
展开
-
机器学习——集成学习
集成学习:让机器学习效果更好,单个不行,群殴走起。原创 2023-02-27 12:32:33 · 730 阅读 · 1 评论 -
数据挖掘——RFM客户价值模型及航空公司客户分析实例
数据挖掘——RFM客户价值模型及航空公司客户分析实例原创 2022-11-17 22:08:27 · 2030 阅读 · 0 评论 -
特征工程——缺失值显示和填充(集中趋势(众数、平均数、中位数)、缺失值矩阵图、条形图、集中趋势填充)
特征工程——缺失值显示和填充(集中趋势(众数、平均数、中位数)、缺失值矩阵图、条形图、集中趋势填充)原创 2022-10-20 15:48:42 · 2270 阅读 · 0 评论 -
机器学习——随机森林特征选择及周期性分析
随机森林——特征选择(降维)前面的文章有写过PCA降维,虽然随机森林和它都是横向的降维,但是呢PCA降维之后是生成了新的特征(新的特征是原来特征的线性组合,但是呢这个新的特征没有赋给现实的含义);而随机森林是从中挑选出更有价值的特征。原创 2022-10-09 16:05:58 · 3860 阅读 · 2 评论 -
主成分分析——PCA降维Python实现及碎石图
多元统计分析处理的是多变量问题。由于变量较多,增加了分析问题的复杂性。但在实际问题中,变量过多会存在一定的相关性,因此,多变量中可能会存在信息的重叠。在我们进行数据处理的时候为了提高计算速度、去除多余的特征、减少过拟合的可能;我们会经常用到降维进行数据预处理,用较少的变量代替原来较多的变量。原创 2022-10-05 07:13:56 · 5829 阅读 · 3 评论 -
Python——时间序列的可视化、日期显示格式
时间序列(或称动态数列)是指将同一统计指标的数值按其发生的时间先后顺序排列而成的数列。时间序列数据本质上反映的是某个或者某些随机变量随时间不断变化的趋势,而时间序列预测方法的核心就是从数据中挖掘出这种规律,并利用其对将来的数据做出估计。原创 2022-10-03 10:34:54 · 2700 阅读 · 1 评论 -
异常数据处理——3σ原则、箱线图
异常数据处理——3σ原则、箱线图用不包括异常值的剩余数据的均值替换、删除DataFrame中某列有异常值的整行等方法原创 2022-09-27 02:15:00 · 6225 阅读 · 3 评论 -
数据挖掘——关联分析基础介绍(上)
数据挖掘——关联分析基础介绍(上)原创 2022-07-28 20:39:00 · 810 阅读 · 0 评论 -
数据挖掘——关联分析例题代码实现(下)
数据挖掘——关联分析例题代码实现(下)原创 2022-07-29 01:00:00 · 929 阅读 · 4 评论 -
K-MEANS聚类——Python实现
(1)物以类聚,人以群分,聚类分析是一种重要的多变量统计方法,但记住其实它是一种数据分析方法,不能进行统计推断的。当然,聚类分析主要应用在市场细分等领域,也经常采用聚类分析技术来实现对抽样框的分层。它和分类不同,它属于无监督问题。......原创 2022-08-16 12:04:22 · 22724 阅读 · 0 评论 -
DBSCAN聚类——Python实现
DBSCAN聚类——Python实现,DBSCAN(Density-Baseed Spatial Clustering of Applications with Noise)聚类算法原创 2022-08-17 20:33:23 · 6679 阅读 · 0 评论 -
K-MEANS聚类之图像分割Python实现
K-MEANS聚类之图像分割Python实现原创 2022-08-19 17:41:04 · 1480 阅读 · 0 评论 -
Python实现机器学习算法——朴素贝叶斯
数据挖掘——朴素贝叶斯算法原创 2022-08-01 13:20:18 · 6852 阅读 · 4 评论