之前在知乎上刷到一篇使用Excel完成数据分析的文章,于是我想到用Python来进行同样的数据分析。
原Excel数据分析文章地址:https://zhuanlan.zhihu.com/p/47707508
使用到Python的numpy、pandas、motplotlib
代码及结果如下:
//引入相应模块
import csv
import numpy as np
import pandas as pd
import matplotlib
import matplotlib.pyplot as plt
from scipy import stats
plt.rcParams['font.sans-serif']=['SimHei']
plt.rcParams['axes.unicode_minus']=False
%matplotlib inline
//读取数据并进行重命名
data = pd.read_csv('appendix.csv')
data.rename(columns = ({'Institution':'课程持有机构',
'Course Number':'课程编号ID',
'Launch Date':'上线日期',
'Course Title':'课程名称',
'Instructors':'讲师',
'Course Subject':'课程主题',
'Year':'课程持续时间',
'Honor Code Certificates':'是否提供认证',
'Participants (Course Content Accessed)':'学生人数',
'Audited (> 50% Course Content Accessed)':'完成50%以上课程的人数',
'Certified':'拿到认证的人