版本:python3.6
正在学习python,然后尝试数据分析。
pandas模块:
import pandas
c = './learn.xlsx' # 导入Excel表格
b = pandas.read_excel(c,index_col='日期') # 以日期作为索引列
print(len(b)) # 打印所有的数据记录
print(b.describe()) # 查看数据的情况
Excel表如下:
代码输出如下:
5 # 代表数据的总条数
身高
count 4.000000 # count 表示有效数据,缺失了5.12那天的。
mean 151.750000 # 平均值
std 1.707825 # 标准差
min 150.000000 # 最小值
25% 150.750000 # 分位数
50% 151.500000
75% 152.500000
max 154.000000
————————————————————————
使用下面语句截取数据:
a = b[(b['身高']>151)] # 取出身高大于151的数据
d = a.describe()
d.loc['range'] = d.loc['max'] - d.loc['min'] # 使用这个语句增加range输出
print(d)
代码输出如下:
身高
count 2.000000
mean 153.000000
std 1.414214
min 152.000000
25% 152.500000
50% 153.000000
75% 153.500000
max 154.000000
range 2.000000
not end