Python数据分析及可视化—亚太地区25所商学院

《商务与经济统计》案例3-3

亚太地区的商学院

源数据

在这里插入图片描述

第一题:计算数据集的描述统计量
import pandas as pandas

//pandas 读取数据
data = pandas.read_excel('/Users/python/源数据/亚太地区25所商学院.xlsx')
//describe可以描述数据的一些描述性统计信息
data.describe()
describe的结果

源数据mean:平均数
std:标准差
后面的就是最小值,百分位到最大值了

  1. 录取名额:
    25所商学院平均录取名额为165人,这些学院录取名额之间的标准差为141,最少的录取为12人,最多录取463人,极差451人,不同学校之间录取名额相差大。
  2. 学费:
    本国学生平均学费为12375美元,而国外学生的平均学费为16582美元,本国学生比国外学生平均学费低4207美元。而且本国学生各百分位数的学费值都比国外学生学费低。
  3. 年龄:
    商学院学生平均年龄为28岁,最小的学生22岁,虽大的学生37岁。
  4. 国外学生比例:
    国外学生占比平均28%,最少的没有国外学生,最多的学校国外学生占90%。
  5. 起薪:
    不同商学院之间的起薪平均为37292美元,最少的起薪7000美元,最高的起薪为87000美元,极差80000美元。
    各个商学院之间学生在各方面的差距都还是比较大的。
第二题:a.本国学生与外国学生学费的差别
# -*-coding:utf-8-*-

import numpy as numpy
import pandas as pandas
import matplotlib.pyplot as plt

data = pandas.read_excel('/Users/python/源数据/亚太地区25所商学院.xlsx')
description = data.describe()

//本国学生学费
height_local = data['Local Tuition ($)'] 
//外国学生学费
height_foreign = data['Foreign Tuitiion ($)']
x_lable = data['Business School']

//以下两句输出结果都为0,1,2,3,4,5···到24
xaixs = list(range(len(height_local)))
x = numpy.arange(25)

//表格标题
plt.title('Local Tuition & Foreign Tuitiion')

//画第一个柱状图,tick_label 参数:在X轴上标示X的“值”,只设置一个就可以
plt.bar(x,height_local,width=0.4,label='local',tick_label=x_lable)
plt.bar(x+0.4,height_foreign,width=0.4,label='foreign')
//注意两个柱状图的宽度和间距,不然会有重叠
plt.xlabel('Business School') 
plt.ylabel('($)')

//x轴的值旋转-90度,因为学校名字太长,不旋转会重叠
plt.xticks(rotation=-90)
//设置标记刻度大小
plt.tick_params(labelsize=8)
//图例加到图像内侧
plt.legend()
plt.show()

在这里插入图片描述
1.本国学生平均学费为12375美元,而国外学生的平均学费为16582美元,本国学生比国外学生平均学费低4207美元。
2.本国学生学费和外国学生最低学费都为1000美元,是孟买的商学院。最高学费也相同,为33060美元,是日本国际大学,但是25%,50%,75%各百分位数的学费本国学生都比国外学生低。还是本国学生的学费比较优惠

第二题:b.要求工作经验和无工作经验的学校学生起薪差别
//起薪按照工作经验分组
salaries = data['Starting Salary ($)'].groupby(data['Work Experience'])
//输出分组后的描述统计量
salaries.describe()

在这里插入图片描述
1.没有工作经验的6个,占24%。平均起薪24583美元,最低7100美元,最高87000美元。
有工作经验的19个,占76%。平均起薪为41305美元,最低7000美元,最高71400美元。
2.平均来说,有工作经验的起薪还是无工作经验起薪的2倍,虽然最低起薪几乎相同,但是25%,50%,75%的各个阶段的起薪值都比无工作经验的起薪要高很多。
3.无工作经验的在前50%的范围内,没有太大差距,在50%的位置,起薪为7500美元,但是后50%的起薪差距特别大。
总结:是不是代表,大体来说,还是要有工作经验,但是如果你特别厉害,没有工作经验也能拿到很高的起薪

第二题:c.要求英语测试和不要求英语测试学校学生起薪差别
//起薪按照是否有英语测试分组
english_test = data['Starting Salary ($)'].groupby(data['English Test'])
//输出分组后的描述统计量
english_test.describe()

在这里插入图片描述
1.不要求英语测试的17个,占68%。平均起薪33623美元,最低7100美元,最高71400美元。
要求英语测试的8个,占32%。平均起薪为45087美元,最低16000美元,最高87000美元。
2.平均来说,有英语测试要求比没有英语测试要求的起薪要高,差12000美元。而且有英语要求测试的最低起身为16000美元,是没有英语测试要求的2倍多,前50%位置的起薪,都是有英语测试要求的更高。
总结:大体来说,还是有英语测试,起薪可能会更高。

第三题:学费和起薪有关系吗
//height_foreign  外国学生学费,salaries 起薪
numpy.corrcoef(height_foreign,salaries)
numpy.corrcoef(height_local,salaries)

在这里插入图片描述
两组学生的学费和起薪都成正相关,外国学生学费和起薪相关系数为0.79,本国学生的相关系数为 0.67

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值