python数据可视化的特点_python数据可视化1：单特征

最新推荐文章于 2022-10-18 15:04:26 发布

weixin_39914107

最新推荐文章于 2022-10-18 15:04:26 发布

阅读量150

点赞数

文章标签： python数据可视化的特点

1 概述

数据可视化，从数据层面，包括以下两块内容：

a单变量的可视化：主要研究变量的自身特性

b多变量的联合可视化：主要研究变量与变量之间的相关性

其中，单变量的可视化，要根据数据的类型来分别处理：

分类变量(categorical variable)

常用的有：饼图、柱形图

数值变量(numerical variable)

常用的有：概率密度图、直方图、箱式图

2 导入数据

29381f30e924b89903135b2a83b573910a7bf629.jpeg?token=6a02af1ac88b03a63cebc0d0b869cab6&s=4AAC3C6297F46D82585DB0CB0000E0B1

3 分类特征

分类特征主要看两个方面：

a有几种分类

b每种分类的数量（或者比例）

这里为了演示，用day变量，代表了星期。

mon 74tue 64wed 54thu 61fri 85sat 84sun 95Name: day, dtype: int64结果为，可以看到，数据集里这个变量的分布还算平均。

3.1 饼图

注意分类的种类不能太多，不然饼图就会被切得很细。

a pandas.Series.plot.pie

用autopct设置数字的格式。

79f0f736afc3793165ea82ab0077d94141a911ed.jpeg?token=41ab42cd729919ef06b4be080692068d&s=50BA887202AE7F07548CE3BE03007023

3.2 柱状图

a pandas.Series.plot.pie

a5c27d1ed21b0ef4d44d067c31773fde80cb3ea7.jpeg?token=06317f6fd8b8572baea73c450ae94c2c&s=29AE5832DEC7FB1B94D5ACE002007036

b matplotlib.pyplot.bar

b3119313b07eca80baa923a27a90f9d9a044837b.jpeg?token=766a46635109bbf97069db4cccbe6ee6&s=79221472C687AB1BA482B0C20200F0B9

c seaborn.barplot

6c224f4a20a44623bb7aa0bc73911c0a0ef3d7f0.jpeg?token=48862a400b2cd3ccd2d6f02b69e70926&s=30325C32CE87EB1BF495ECE002003036

d seaborn.countplot

b7003af33a87e950e714f5c9fb8b3d47faf2b448.jpeg?token=b8f389d57249088a5510298ade72138a&s=30225C32C4879B1B151489E502007022

用这个的好处在于，自动计算取值及其数量并可视化，节省一个步骤。函数中，可以设置order=order来指定顺序。

4 数值特征

数值特征主要看两个方面：它的取值区间，不同子区间的数量分布(或者密度分布)。

为了演示，用temp变量，代表温度。

4.1 直方图

a pandas.Series.plot.hist

b999a9014c086e0666be41b6e9bb15f00bd1cb75.jpeg?token=42b8a9f9f0c43321c02552eff8ec73ff&s=792A34734AC7B209AEF799C7020030EB

b matplotlib.pyplot.hist

d833c895d143ad4b85bc4cb069b134aba50f0663.jpeg?token=f215b6fcad2832332e99f84237da637d&s=7B223C634AC7B209AFD79DC7020020E9

c seaborn.rugplot

f3d3572c11dfa9ec3249741d8e639907908fc189.jpeg?token=fa208eed8681751eef339f93c30d64d3&s=5AA434624057F32896C21F6502003068

4.2 概率密度图

a pandas.Series.plot.density

f2deb48f8c5494eedea037b8c6468efa9b257ecc.jpeg?token=ae09be3dfcb039b8197464d4bf9c978a&s=58283C72331B446D0C51B1CA0000C0B1

b seaborn.kdeplot

a8773912b31bb051606d9e0ddac9b4b04bede086.jpeg?token=91789b3b1f323d9c93271ec25d2e194b&s=782A3C72F1124C651E75F1CA0000C0B1

c seaborn.distplot

3ac79f3df8dcd1004fc5b9419e382914b8122fa9.jpeg?token=efba1891a09aa974464917b253c134e3&s=98285C326B10624D4ED595C70200E0A1

4.3 箱式图

a pandas.Series.plot.box

e1fe9925bc315c60e7bf31786602a517485477b3.jpeg?token=9b4f2f79d9f030ac04ba317b04f9fd55&s=5A8C3C620323412A4CF595CA0000A0B1

b matplotlib.pyplot.boxplot

0e2442a7d933c8958e059f963aa01df48302001f.jpeg?token=fda0750f4df8e8495343dcd687378455&s=5A8C3C620337482A54F515CE0000A0B1

c seaborn.boxplot

orient默认值是h（水平），也可以设为v（垂直）。

a71ea8d3fd1f4134e7afdbc7ceacfbced0c85e23.jpeg?token=8d03b3a658d1fc47dbc9e387a20e47ac&s=7B283C628EDEFE090FC791C60200A0B3

weixin_39914107

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫