数据分析与挖掘
无名之辈W
不忘初心,方得始终
展开
-
数据分析 | 基础复习 | pandas+matplotlib
pandas中的describe()函数python pandas中,对于一维数组,describe会返回一系列参数,count,mean,std,min,25%,50%,75%,max。describe()返回值的解释如下:1、count:返回数组的个数,如上述为4个元素,所以返回为4;2、mean:返回数组的平均值,1 3 5 9的平均值为4.5;3、std:返回数组的标准差;4、min:返回数组的最小值;5、25%,50%,75%:返回数组的三个不同百分位置的数值,也就是统计学中的四分位原创 2020-11-04 21:48:23 · 704 阅读 · 0 评论 -
数据分析——聚类部分知识复习
文章目录构建并评价聚类模型使用sklearn估计器构建K-Means聚类模型评价聚类模型构建并评价聚类模型聚类分析:即在没有给定类别标签的情况下根据数据的相似度进行样本分组。将无标签标记的数据聚集为多个簇,每个簇就是一类,是一种非监督学习的方法。应用:从消费者数据库中区分出不同的消费群体,并概括出每一类消费者的消费习惯或者模式;也可作为数据分析算法中其他分析算法的一个预处理步骤,如异常值识别、连续特征离散化等。使用sklearn估计器构建K-Means聚类模型聚类划分原则:组内举例最小原创 2020-07-01 15:07:05 · 938 阅读 · 2 评论