数据分析与挖掘——学习笔记

版本:python3.6

正在学习python,然后尝试数据分析。

pandas模块:

import pandas
c = './learn.xlsx'  # 导入Excel表格
b = pandas.read_excel(c,index_col='日期')  # 以日期作为索引列
print(len(b)) # 打印所有的数据记录
print(b.describe())  # 查看数据的情况

Excel表如下:


代码输出如下:

5                       # 代表数据的总条数
               身高   
count    4.000000        # count 表示有效数据,缺失了5.12那天的。
mean   151.750000        # 平均值
std      1.707825        # 标准差
min    150.000000        # 最小值
25%    150.750000        # 分位数
50%    151.500000
75%    152.500000
max    154.000000   

————————————————————————

使用下面语句截取数据:

a = b[(b['身高']>151)] # 取出身高大于151的数据
d = a.describe()
d.loc['range'] = d.loc['max'] - d.loc['min']  # 使用这个语句增加range输出
print(d)

代码输出如下:

               身高
count    2.000000
mean   153.000000
std      1.414214
min    152.000000
25%    152.500000
50%    153.000000
75%    153.500000
max    154.000000
range    2.000000

not end


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值