女生的体重,是这个世上最神秘的秘密,O(∩_∩)O哈哈~
用Python中的Pandas来分析浪姐们的身高,附源码
import pandas as pd
import matplotlib.pyplot as plt
data = [['宁静',168],['伊能静',161],['袁咏琳',166],['丁当',162],['王丽坤',167],['白冰',165],
['海陆',169],['刘芸',165],['张含韵',162],['许飞',162],['郁可唯',168],['李斯丹妮',172],
['钟丽缇',168],['陈松伶',169],['沈梦辰',171],['郑希怡',171],['阿朵',166],['万茜',166],
['王霏霏',165],['孟佳',165],['蓝盈莹',169],['金晨',171],['吴昕',162],['张雨绮',166],
['王智',166],['张萌',169],['黄圣依',165],['黄龄',167],['金莎',166],['朱婧汐',168]]
columns = ['浪姐','身高']
df = pd.DataFrame(data=data,columns=columns)
df1=df.sort_values(by='身高',ascending=True) # 身高降序排序
mean=df['身高'].mean() # 浪姐身高平均数
median=df['身高'].median() # 浪姐身高中位数
mode=df['身高'].mode().iloc[0] # 浪姐身高先取众数,iloc取行号(第一行)
print('浪姐平均身高:'+str(mean))
print('浪姐身高中位数:'+str(median))
print('浪姐身高众数:'+str(mode))
print('------身高170以上的------')
print(df[df['身高']>=170])
print('------浪姐里谁最高------')
print(df[df['身高']==df['身高'].max()])
print('------浪姐里谁最矮------')
print(df[df['身高']==df['身高'].min()])
print('------身高区间和人数------')
# 身高数据面元化
bins = [160, 165, 170, 175]
cats = pd.cut(df['身高'], bins)
print(pd.value_counts(cats))
plt.rcParams['font.sans-serif']=['SimHei'] #解决中文乱码
plt.title('《乘风破浪的姐姐》身高对比',fontsize='18') #图表标题
x=df1['浪姐']
y=df1['身高']
plt.xlim(155,175)
# 身高中位数参考线
plt.axvline(median,color='blue',linestyle='--',)
plt.barh(x,y,label='身高',color='r')
plt.show()
浪姐平均身高:166.6
浪姐身高中位数:166
浪姐身高众数:166
身高170以上的有:李斯丹妮、沈梦辰、郑希怡、金晨
浪姐身高最高的是:李斯丹妮
浪姐身高最矮的是:伊能静
170~175:4人
165~170:16人
160~165:10人
人人都应掌握的数据分析技能你究竟了解多少?更多数据分析内容,可参阅
全彩版《Python数据分析从入门到实践》满100减50原创不易,如果觉得有点用,希望可以随手点个赞,拜谢各位老铁。