python:matplotlib.pyplot绘制箱线图并 检测异常值(基础一)

本文介绍了如何使用Python的pandas和matplotlib库绘制箱线图,检测数据集(data01.xls)中的异常值,并通过计算四分位数和四分位距来识别并移除潜在的异常值。通过箱线图展示和统计分析,提升数据质量理解。
摘要由CSDN通过智能技术生成

在数据处理中,箱线图常用来检测异常值。

数据文件data01.xls

1.绘制箱线图使用boxplot()函数

import pandas as pd
import matplotlib.pyplot as plt

# 读取excel文件
file_01 = pd.read_excel("data01.xls")

fig = plt.figure(figsize=(16, 8))
d1 = file_01['变量1']
d2 = file_01['变量2']
d3 = file_01['变量3']
d4 = file_01['变量4']

label = '变量1', '变量2', '变量3', '变量4'
plt.boxplot([d1, d2, d3, d4], labels=label)  # label设置横轴每个箱图对应的横坐标
plt.xticks(fontproperties='KaiTi')
plt.xlabel('变量', fontproperties='KaiTi')
plt.ylabel('变量值', fontproperties='KaiTi')

plt.show()

matplotlib.pyplot.boxplot函数用于绘制箱线图箱线图是一种用于展示数据分布的图形,它展示了数据的中位数、上下四分位数、最小值和最大值等统计信息。在箱线图中,数据通过一个箱子表示,箱子的上边界和下边界分别表示上四分位数和下四分位数,箱子中间的线表示中位数。此外,箱线图还可以显示异常值和离群。 函数调用方式: ```python matplotlib.pyplot.boxplot(x, notch=None, sym=None, vert=None, whis=None, positions=None, widths=None, patch_artist=None, bootstrap=None, usermedians=None, conf_intervals=None, meanline=None, showmeans=None, showcaps=None, showbox=None, showfliers=None, boxprops=None, labels=None, flierprops=None, medianprops=None, meanprops=None, capprops=None, whiskerprops=None) ``` 参数说明: - x: 数据集或者数组。可以是一个或多个数组。 - notch: 是否显示箱线图的中位数周围的凹槽。默认为None,表示不显示凹槽。 - sym: 用于表示异常值的标记符号。默认为None,表示不显示异常值。 - vert: 是否将箱线图垂直绘制。默认为True,表示垂直绘制。 - whis: 确定箱线图上下边界的位置,默认为1.5。 - 其他参数用于自定义绘图样式,如颜色、线型、标签等。 示例代码: ```python import matplotlib.pyplot as plt import numpy as np # 创建随机数据 np.random.seed(10) data = np.random.normal(100, 20, size=(100,)) # 绘制箱线图 plt.boxplot(data) # 设置标题和标签 plt.title("Boxplot") plt.xlabel("Data") # 显示图形 plt.show() ``` 这段代码会生成一个简单的箱线图,展示随机生成的数据的分布情况。你可以根据自己的数据和需求调整参数来绘制符合你需求的箱线图
评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值