python里orient_python数据可视化seaborn(四)—— 分类数据可视化

本文介绍了Seaborn库中用于分类数据可视化的各种图形,包括stripplot、swarmplot、boxplot、violinplot和barplot等,并通过实例展示了它们的用法和参数设置,帮助理解不同图形在展示数据分布、统计信息和分类比较上的应用。
摘要由CSDN通过智能技术生成

之前的文章关注的是两个变量都是数值变量的情况,当有一个变量是分类变量的时候,我们就需要其他类型的图形来展示分析数据。在seaborn中有多种类型的图形且非常易于上手。

import numpy as np

import pandas as pd

import matplotlib.pyplot as plt

import seaborn as sns

%matplotlib inline

sns.set(style="whitegrid",font_scale=1.4,context="paper")

# 设置风格、尺度

import warnings

warnings.filterwarnings('ignore')

# 不发出警告

seaborn中,分类图主要分为三个部分:分类散点图:stripplot(默认,kind = "strip")

swarmplot(kind = "swarm")

分类分布图:boxplot(kind="box")

violinplot(kind="violin")

boxenplot(kind="boxen")

分类估计图:pointplot(kind="point")

barplot(kind="bar")

countplot(kind="count")

以上三种系列分别代表了不同粒度级别的数据。当然,在实际使用的过程中,其实没有必要记住这么多,因为seaborn中的分类系列有统一的图形界面catplot(),只需要这一个函数,就能访问所有分类图像类型。

分类散点图

seaborn.stripplot(x=None, y=None, hue=None, data=None, order=None, hue_order=None, jitter=True, dodge=False, orient=None, color=None, palette=None, size=5, edgecolor='gray', linewidth=0, ax=None, **kwargs)jitter : 是否抖动,True,false or float

dodge : 当有hue参数时,是否沿轴分离不同颜色

orient : 图形方向,垂直(“v”)或者水平("h")

# 1、catplot() 默认情况下,kind='strip'

# 按照不同类别对样本数据进行分布散点图绘制

tips = sns.load_dataset("tips")

print(tips.head())

# 加载数据

sns.catplot(x="day", # x → 设置分组统计字段

y="total_bill", # y → 数据分布统计字段

# 这里xy数据对调,将会使得散点图横向分布

data=tips, # data → 对应数据

jitter = True, height=6,

#当点数据重合较多时,jitter可以控制点抖动,也可以设置间距如:jitter = 0.1

s = 6, edgecolor = 'w',linewidth=1,marker = 'o' ,

# 设置点的大小、描边颜色或宽度、点样式

)

-------------------------------------------------------

total_bill tip sex smoker day time size

0 16.99 1.01 Female No Sun Dinner 2

1 10.34 1.66 Male No Sun Dinner 3

2 21.01 3.50 Male No Sun Dinner 3

3 23.68 3.31 Male No Sun Dinner 2

4 24.59 3.61 Female No Sun Dinner 4

# 1、stripplot()

# 通过kind='swarm' 来调整点防止重合

sns

好的,我可以为您提供一些关于Python数据爬取和可视化的基本信息。 首先,Python 有很多用于数据爬取的库,其比较流行的是 Requests 和 BeautifulSoup。Requests 可以用于向网站发送 HTTP 请求,获取网页内容,而 BeautifulSoup 可以用于解析 HTML 和 XML 文件。 下面是一个简单的 Python 程序,用于使用 Requests 和 BeautifulSoup 爬取网页,并将结果保存到本地文件: ```python import requests from bs4 import BeautifulSoup url = 'https://www.example.com' response = requests.get(url) soup = BeautifulSoup(response.text, 'html.parser') with open('output.html', 'w', encoding='utf-8') as f: f.write(str(soup)) ``` 这个程序会向 https://www.example.com 发送 HTTP 请求,获取网页内容,并使用 BeautifulSoup 解析 HTML 内容。最后,它将结果保存到名为 output.html 的本地文件。 接下来是关于 Python 数据可视化的信息。Python 有很多用于数据可视化的库,其比较流行的是 Matplotlib 和 Seaborn。Matplotlib 是一个基础的绘图库,可以用于创建各种类型的图表,包括线图、散点图、柱状图等等。Seaborn 是一个基于 Matplotlib 的高级绘图库,它可以创建更加复杂的图表,包括热力图、分布图、聚类图等等。 下面是一个使用 Matplotlib 和 Pandas 库绘制柱状图的例子: ```python import pandas as pd import matplotlib.pyplot as plt data = {'apples': 10, 'oranges': 15, 'pears': 5, 'bananas': 20} df = pd.DataFrame.from_dict(data, orient='index', columns=['quantity']) ax = df.plot(kind='bar', legend=False) plt.title('Fruit quantities') plt.xlabel('Fruit') plt.ylabel('Quantity') plt.show() ``` 这个程序会创建一个 Pandas 数据框,其包含水果名称和数量。然后,它使用 Matplotlib 创建一个柱状图,并添加标题、轴标签等。最后,它显示图表。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值