用
python
进行数据分析
一、样本集
本样本集来源于某高中某班
78
位同学的一次月考的语文成绩。因为每位同学的成绩都
是独立的随机变量,遂可以保证得到的观测值也是独立且随机的
样本如下:
grades=[131,131,127,123,126,129,116,114,115,116,123,122,118,
121,126,121,126,121,111,119,124,124,121,116,114,116,
116,118,112,109,114,116,116,118,112,109,114,110,114,
110,113,117,113,121,105,127,110,105,111,112,104,103,
130,102,118,101,112,109,107,94,107,106,105,101,85,95,
97,99,83,87,82,79,99,90,78,86,75,66];
二、数据分析
1.
中心位置(均值、中位数、众数)
数据的中心位置是我们最容易想到的数据特征。借由中心位置,我们可以知
道数据的一个平均情况,
如果要对新数据进行预测,
那么平均情况是非常直观地
选择。
数据的中心位置可分为均值
(
Mean
)
,
中位数
(
Median
)
,
众数
(
Mode
)
。
其中均值和中位数用于定量的数据,众数用于定性的数据。
均值:利用
python
编写求平均值的函数很容易得到本次样本的平均值
得到本次样本均值为
109.9
中位数:
113
众数:
116
2.
频数分析
2.1
频数分布直方图
柱状图是以柱的高度来指代某种类型的频数,
使用
Matplotlib
对成绩这一定性变量绘制
柱状图的代码如下: