数据分析与挖掘——学习笔记

最新推荐文章于 2022-10-24 23:21:10 发布

ttlyb

最新推荐文章于 2022-10-24 23:21:10 发布

阅读量284

点赞数

分类专栏： studying 数据分析挖掘学习文章标签： python

本文链接：https://blog.csdn.net/weixin_42394348/article/details/80613659

版权

studying 同时被 2 个专栏收录

4 篇文章 0 订阅

订阅专栏

数据分析挖掘学习

1 篇文章 0 订阅

订阅专栏

版本：python3.6

正在学习python，然后尝试数据分析。

pandas模块：

import pandas
c = './learn.xlsx'  # 导入Excel表格
b = pandas.read_excel(c,index_col='日期')  # 以日期作为索引列
print(len(b)) # 打印所有的数据记录
print(b.describe())  # 查看数据的情况

Excel表如下：

代码输出如下：

5                       # 代表数据的总条数
               身高   
count    4.000000        # count 表示有效数据，缺失了5.12那天的。
mean   151.750000        # 平均值
std      1.707825        # 标准差
min    150.000000        # 最小值
25%    150.750000        # 分位数
50%    151.500000
75%    152.500000
max    154.000000

————————————————————————

使用下面语句截取数据：

a = b[(b['身高']>151)] # 取出身高大于151的数据
d = a.describe()
d.loc['range'] = d.loc['max'] - d.loc['min']  # 使用这个语句增加range输出
print(d)

代码输出如下：

               身高
count    2.000000
mean   153.000000
std      1.414214
min    152.000000
25%    152.500000
50%    153.000000
75%    153.500000
max    154.000000
range    2.000000

not end