python 一组数据 正态分布散点图_Python实战—小费数据集应用

6f1261fd0a8568f4726c9a329aabf32b.gif

9354128d0871870242713c0b211f432e.gif今天是我在家的......不知道第多少天 4e7943442b58ae2a274bd8ef29e7d1f0.png由于疫情的缘故大家不能出去玩肯定无聊到发慌如果迫不得已要出去的话一定要戴好口罩,勤洗手保护好自己鸭! 2bccb320b2ebe7801a5b19583605d478.png 现在许多高校已经开始延迟开学 不如此时静下心来 趁着这段空闲时间 在家利用网络平台 好好学习新知识 一起学习吧! ba214cf2be2a1a736bf9c5044795f84f.png d85234967707163e462fd79bbedc3f07.gif

一、数据来源

    本节选用的是Python的第三方库seaborn自带的数据集,该小费数据集为餐饮行业收集的数据,其中total_bill为消费总金额、tip为小费金额、sex为顾客性别、smoker为顾客是否吸烟、day为消费的星期、time为聚餐的时间段、size为聚餐人数。
import numpy as npfrom pandas import Series,DataFrameimport pandas as pdimport seaborn as sns   #导入seaborn库tips=sns.load_dataset('tips')#seaborn库自带的数据集tips.head()

91814bed875555ebf7cc592eea5d0ecc.png

二、问题探索 

一、小费金额与消费总金额是否存在相关性? 二、性别、是否吸烟、星期几、聚餐人数和小费金额是否有一定的关联? 三、小费金额占小费总金额的百分比是否服从正态分布?

三、数据清洗

tips.shape #数据集的维度
(244,7) 共有244条数据,7列。
tips.describe() #描述统计

30e7e0a34c7d46381ef733f3ffe947d2.png

描述统计结果如上所示。

tips.info() #查看缺失值信息

28efa6629d7aff05b46da2184bf67eb6.png

此例无缺失值。

四、数据探索

tips.plot(kind='scatter',x='total_bill',y='tip') #绘制散点图
057c4701f4a0cba69730006bef9a9afb.png 由图可看出,小费金额与消费总金额存在正相关性。
male_tip = tips[tips['sex'] == 'Male']['tip'].mean() #男性平均消费金额male_tip

3.0896178343949052

female_tip = tips[tips['sex'] == 'Female']['tip'].mean() #女性平均消费金额female_tip

2.833448275862069

s = Series([male_tip,female_tip],index=['male','female'])s

male      3.089618

female    2.833448

dtype: float64

s.plot(kind='bar') #男女平均小费柱状图

6a5c7f6e1d8dfd16c064ed11613af48d.png

由图可看出,女性小费金额小于男性小费金额。
tips['day'].unique() #日期的唯一值 
[Sun, Sat, Thur, Fri] Categories (4, object): [Sun, Sat, Thur, Fri]
sun_tip = tips[tips['day'] == 'Sun']['tip'].mean()sat_tip = tips[tips['day'] == 'Sat']['tip'].mean()thur_tip = tips[tips['day'] == 'Thur']['tip'].mean()fri_tip = tips[tips['day'] == 'Fri']['tip'].mean()#各个日期的平均小费值s = Series([thur_tip,fri_tip,sat_tip,sun_tip],index=['Thur','Fri','Sat','Sun'])s

 792fe0feb8d0c67c4608c015fc65f555.png

s.plot(kind='bar') #日期平均小费柱状图

93ef675aa7a2be3876cf6607ff27f35d.png

由图可看出,周六、周日的小费比周四、周五的小费高。
tips['percent_tip'] = tips['tip']/(tips['total_bill']+tips['tip'])tips.head(10) #小费所占百分比

023e3577ce149087434fc75e94f3e62b.png

tips['percent_tip'].hist(bins=50)#小费百分比直方图

96868cfd1cd65fe73cd28e4b06d5213d.png

由图可看出,小费金额占小费总金额的百分比基本服从正态分布。 d85234967707163e462fd79bbedc3f07.gif由于公众号没有开通留言功能大家可以在公众号后台联系作者喜欢文章的朋友麻烦点个再看Python在手天下我有一起努力 35c6cc2ab83a7b6bf6397ee3a2d65bbc.png 2bc013b199110181ff78071dde47ab1e.gif往期 精彩回顾 75024cdda2edf563c92b8ea0a8853869.png

Python软件安装

统计180班QQ群聊文本可视化分析

用数据说话,Python就业前景分析

07ce3a8deb88d43526aceeca824c5267.png 1ffee987429abe0c905d7730b7f0639a.png ca46384a8226643e2e5a26ef89940d30.gif
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值