天猫订单之数据分析与挖掘——离群点检测及可视化

本文通过Python的Pandas和Numpy库对天猫订单数据进行离群点检测,使用K-Means聚类算法识别离群点,并通过Matplotlib展示了各地区订单的散点图、饼图、折线图和条形图,揭示了全国范围内线上交易的普及和消费者购买行为的特征。
摘要由CSDN通过智能技术生成

天猫订单之数据分析与挖掘——离群点检测及可视化



0. 写在前面

  • Windows:Windows10
  • Python:Python3.9

本次案例项目主要是采用Pandas和Numpy对天猫订单数据集进行处理、挖掘、分类和聚类分析,最终利用数据可视化工具Matplotlib展示各地区在天猫平台的消费情况。

1. 离群点检测

说明:由于数据量较大,会导致离群点的检测的效果图明显重叠,此处只选择前1000条数据集作为测试的数据集。

1.1 步骤

步骤如下:

先采用K-Means算法对数据点进行聚类,此处选择K-Means聚类算法将样本数据集聚成K(K=3)簇,并找到各簇的质心,计算出每个数据订单的相对距离,相对距离小于等于阈值的订单即可认为是正常点,大于阈值的认为是离群点,最终通过绘制出相对距离图便可以看出来结果。

代码如下:

import pandas as pd
im
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值