python数据可视化的特点_python数据可视化1:单特征

1 概述

数据可视化,从数据层面,包括以下两块内容:

a单变量的可视化:主要研究变量的自身特性

b多变量的联合可视化:主要研究变量与变量之间的相关性

其中,单变量的可视化,要根据数据的类型来分别处理:

分类变量(categorical variable)

常用的有:饼图、柱形图

数值变量(numerical variable)

常用的有:概率密度图、直方图、箱式图

2 导入数据

29381f30e924b89903135b2a83b573910a7bf629.jpeg?token=6a02af1ac88b03a63cebc0d0b869cab6&s=4AAC3C6297F46D82585DB0CB0000E0B1

3 分类特征

分类特征主要看两个方面:

a有几种分类

b每种分类的数量(或者比例)

这里为了演示,用day变量,代表了星期。

mon 74tue 64wed 54thu 61fri 85sat 84sun 95Name: day, dtype: int64结果为,可以看到,数据集里这个变量的分布还算平均。

3.1 饼图

注意分类的种类不能太多,不然饼图就会被切得很细。

a pandas.Series.plot.pie

用autopct设置数字的格式。

79f0f736afc3793165ea82ab0077d94141a911ed.jpeg?token=41ab42cd729919ef06b4be080692068d&s=50BA887202AE7F07548CE3BE03007023

79f0f736afc3793165ea82ab0077d94141a911ed.jpeg?token=41ab42cd729919ef06b4be080692068d&s=50BA887202AE7F07548CE3BE03007023

3.2 柱状图

a pandas.Series.plot.pie

a5c27d1ed21b0ef4d44d067c31773fde80cb3ea7.jpeg?token=06317f6fd8b8572baea73c450ae94c2c&s=29AE5832DEC7FB1B94D5ACE002007036

b matplotlib.pyplot.bar

b3119313b07eca80baa923a27a90f9d9a044837b.jpeg?token=766a46635109bbf97069db4cccbe6ee6&s=79221472C687AB1BA482B0C20200F0B9

c seaborn.barplot

6c224f4a20a44623bb7aa0bc73911c0a0ef3d7f0.jpeg?token=48862a400b2cd3ccd2d6f02b69e70926&s=30325C32CE87EB1BF495ECE002003036

d seaborn.countplot

b7003af33a87e950e714f5c9fb8b3d47faf2b448.jpeg?token=b8f389d57249088a5510298ade72138a&s=30225C32C4879B1B151489E502007022

用这个的好处在于,自动计算取值及其数量并可视化,节省一个步骤。函数中,可以设置order=order来指定顺序。

4 数值特征

数值特征主要看两个方面:它的取值区间,不同子区间的数量分布(或者密度分布)。

为了演示,用temp变量,代表温度。

4.1 直方图

a pandas.Series.plot.hist

b999a9014c086e0666be41b6e9bb15f00bd1cb75.jpeg?token=42b8a9f9f0c43321c02552eff8ec73ff&s=792A34734AC7B209AEF799C7020030EB

b matplotlib.pyplot.hist

d833c895d143ad4b85bc4cb069b134aba50f0663.jpeg?token=f215b6fcad2832332e99f84237da637d&s=7B223C634AC7B209AFD79DC7020020E9

c seaborn.rugplot

f3d3572c11dfa9ec3249741d8e639907908fc189.jpeg?token=fa208eed8681751eef339f93c30d64d3&s=5AA434624057F32896C21F6502003068

4.2 概率密度图

a pandas.Series.plot.density

f2deb48f8c5494eedea037b8c6468efa9b257ecc.jpeg?token=ae09be3dfcb039b8197464d4bf9c978a&s=58283C72331B446D0C51B1CA0000C0B1

b seaborn.kdeplot

a8773912b31bb051606d9e0ddac9b4b04bede086.jpeg?token=91789b3b1f323d9c93271ec25d2e194b&s=782A3C72F1124C651E75F1CA0000C0B1

c seaborn.distplot

3ac79f3df8dcd1004fc5b9419e382914b8122fa9.jpeg?token=efba1891a09aa974464917b253c134e3&s=98285C326B10624D4ED595C70200E0A1

4.3 箱式图

a pandas.Series.plot.box

e1fe9925bc315c60e7bf31786602a517485477b3.jpeg?token=9b4f2f79d9f030ac04ba317b04f9fd55&s=5A8C3C620323412A4CF595CA0000A0B1

b matplotlib.pyplot.boxplot

0e2442a7d933c8958e059f963aa01df48302001f.jpeg?token=fda0750f4df8e8495343dcd687378455&s=5A8C3C620337482A54F515CE0000A0B1

c seaborn.boxplot

orient默认值是h(水平),也可以设为v(垂直)。

a71ea8d3fd1f4134e7afdbc7ceacfbced0c85e23.jpeg?token=8d03b3a658d1fc47dbc9e387a20e47ac&s=7B283C628EDEFE090FC791C60200A0B3

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值