《商务与经济统计》案例3-3
亚太地区的商学院
源数据
第一题:计算数据集的描述统计量
import pandas as pandas
//pandas 读取数据
data = pandas.read_excel('/Users/python/源数据/亚太地区25所商学院.xlsx')
//describe可以描述数据的一些描述性统计信息
data.describe()
describe的结果
mean:平均数
std:标准差
后面的就是最小值,百分位到最大值了
- 录取名额:
25所商学院平均录取名额为165人,这些学院录取名额之间的标准差为141,最少的录取为12人,最多录取463人,极差451人,不同学校之间录取名额相差大。 - 学费:
本国学生平均学费为12375美元,而国外学生的平均学费为16582美元,本国学生比国外学生平均学费低4207美元。而且本国学生各百分位数的学费值都比国外学生学费低。 - 年龄:
商学院学生平均年龄为28岁,最小的学生22岁,虽大的学生37岁。 - 国外学生比例:
国外学生占比平均28%,最少的没有国外学生,最多的学校国外学生占90%。 - 起薪:
不同商学院之间的起薪平均为37292美元,最少的起薪7000美元,最高的起薪为87000美元,极差80000美元。
各个商学院之间学生在各方面的差距都还是比较大的。
第二题:a.本国学生与外国学生学费的差别
# -*-coding:utf-8-*-
import numpy as numpy
import pandas as pandas
import matplotlib.pyplot as plt
data = pandas.read_excel('/Users/python/源数据/亚太地区25所商学院.xlsx')
description = data.describe()
//本国学生学费
height_local = data['Local Tuition ($)']
//外国学生学费
height_foreign = data['Foreign Tuitiion ($)']
x_lable = data['Business School']
//以下两句输出结果都为0,1,2,3,4,5···到24
xaixs = list(range(len(height_local)))
x = numpy.arange(25)
//表格标题
plt.title('Local Tuition & Foreign Tuitiion')
//画第一个柱状图,tick_label 参数:在X轴上标示X的“值”,只设置一个就可以
plt.bar(x,height_local,width=0.4,label='local',tick_label=x_lable)
plt.bar(x+0.4,height_foreign,width=0.4,label='foreign')
//注意两个柱状图的宽度和间距,不然会有重叠
plt.xlabel('Business School')
plt.ylabel('($)')
//x轴的值旋转-90度,因为学校名字太长,不旋转会重叠
plt.xticks(rotation=-90)
//设置标记刻度大小
plt.tick_params(labelsize=8)
//图例加到图像内侧
plt.legend()
plt.show()
1.本国学生平均学费为12375美元,而国外学生的平均学费为16582美元,本国学生比国外学生平均学费低4207美元。
2.本国学生学费和外国学生最低学费都为1000美元,是孟买的商学院。最高学费也相同,为33060美元,是日本国际大学,但是25%,50%,75%各百分位数的学费本国学生都比国外学生低。还是本国学生的学费比较优惠
第二题:b.要求工作经验和无工作经验的学校学生起薪差别
//起薪按照工作经验分组
salaries = data['Starting Salary ($)'].groupby(data['Work Experience'])
//输出分组后的描述统计量
salaries.describe()
1.没有工作经验的6个,占24%。平均起薪24583美元,最低7100美元,最高87000美元。
有工作经验的19个,占76%。平均起薪为41305美元,最低7000美元,最高71400美元。
2.平均来说,有工作经验的起薪还是无工作经验起薪的2倍,虽然最低起薪几乎相同,但是25%,50%,75%的各个阶段的起薪值都比无工作经验的起薪要高很多。
3.无工作经验的在前50%的范围内,没有太大差距,在50%的位置,起薪为7500美元,但是后50%的起薪差距特别大。
总结:是不是代表,大体来说,还是要有工作经验,但是如果你特别厉害,没有工作经验也能拿到很高的起薪
第二题:c.要求英语测试和不要求英语测试学校学生起薪差别
//起薪按照是否有英语测试分组
english_test = data['Starting Salary ($)'].groupby(data['English Test'])
//输出分组后的描述统计量
english_test.describe()
1.不要求英语测试的17个,占68%。平均起薪33623美元,最低7100美元,最高71400美元。
要求英语测试的8个,占32%。平均起薪为45087美元,最低16000美元,最高87000美元。
2.平均来说,有英语测试要求比没有英语测试要求的起薪要高,差12000美元。而且有英语要求测试的最低起身为16000美元,是没有英语测试要求的2倍多,前50%位置的起薪,都是有英语测试要求的更高。
总结:大体来说,还是有英语测试,起薪可能会更高。
第三题:学费和起薪有关系吗
//height_foreign 外国学生学费,salaries 起薪
numpy.corrcoef(height_foreign,salaries)
numpy.corrcoef(height_local,salaries)
两组学生的学费和起薪都成正相关,外国学生学费和起薪相关系数为0.79,本国学生的相关系数为 0.67