Pandas

最新推荐文章于 2023-12-25 07:00:00 发布

小黄鸭会飞呀

最新推荐文章于 2023-12-25 07:00:00 发布

阅读量90

点赞数

分类专栏：账房

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_45510671/article/details/116536424

版权

账房专栏收录该内容

1 篇文章 0 订阅

订阅专栏

读写数据

读取
- 格式
  - pd.read_xxx('https://xxx.xxx')
  - pd.read_xxx('xxx.xlsx')
- 类型
  - pd.read_excel()
  - pd.read_csv()
写入
- df.to_excel('xxx.xlsx')
- df.to_csv('team-done.csv')

数据概况

df.info() # 查看数据类型、索引情况、行列数、字段类型、内存等
df.describe() # 计算数字字段的总数、平均数、标准差、最大值、最小值、四分位数
df.axes # 查看行数和列字段
df.shape # 查看行数和列数
df.index # 查看行索引
df.columns # 查看列字段
df.types # 查看各字段类型

列操作

df['name']
- 获取name列
df.name
- 同上
df[['name', 'age']]
- 获取name、age两列
df.loc[:,['name', 'age']]
- 同上
df[df.index == 'A']
- 获取指定行的索引列
df['grade'] = 1
- 添加列

索引

设置索引
- df.set_index('name', inplace=True)
  - name # 设置为索引的字段名称
  - inplace # 是更改后的数据生效
获取索引
- df.head(num)
  - num # 获取前n行，默认获取前5行
- df.tail(num)
  - num # 获取后n行，默认获取后5行
- df[df.name > 90]
  - A # 获取指定列大于90的所有行
- df[0:3]
  - 获取指定范围的行
- df[0:10:2]
  - 获取指定范围的行，每两个取一个
- df.iloc[:10, :]
  - 获取指定范围的行

排序

df.sort_values(by='name', ascending=False)
- 按name列升序排序，True为升序，False为降序
df.sort_values(['name', 'age'], ascending=[True, False])
- name升序，age降序

分组聚合

df.groupby('class').sum()
- groupby() # 分组
- sum() # 聚合
df.group('class').agg({'age':sum, 'score':'count'})
- 不同列进行不同聚合

转置

df.groupby('class').sum().T
df.groupby('class').sum().stack()
df.groupby('class').sum().unstack()

函数

函数	作用
df.mean()	返回每一列的均值
df.mean(1)	返回每一行的均值，下同
df.corr()	返回列与列之间的相关系数
df.count()	返回每一列的非空个数
df.max()	返回每一列的最大值
df.min()	返回每一列的最小值
df.median()	返回每一列的中位数
df.std()	返回每一列的标准差
df.var()	求方差
df.mode()	求众数

绘图

df['name'].plot()
- 指定字段绘制图形
df.loc['name', 'A':'B'].plot()
- 指定某行多个字段绘制图形
df.loc['name', 'A':'B'].plot().bar()

函数作用
bar() 柱状图
barh() 横向柱状图
pie() 饼图

小黄鸭会飞呀

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
Pandas

读写数据读取格式pd.read_xxx('https://xxx.xxx')pd.read_xxx('xxx.xlsx')类型pd.read_excel()pd.read_csv()写入df.to_excel('xxx.xlsx')df.to_csv('team-done.csv')数据概况df.info() # 查看数据类型、索引情况、行列数、字段类型、内存等df.describe() # 计算数字字段的总数、平均数、标准差、最大
复制链接

扫一扫

专栏目录

小黄鸭会飞呀

博客等级

码龄5年

33
原创

1
点赞

6
收藏

6
粉丝

关注

私信

热门文章

分类专栏

最新评论

Centos安装Python虚拟环境
不吃西红柿丶: 大侠文采飞扬才情过人李白唐伯虎杜甫泰戈尔在世看此文章必定甘败下风从此无脸见人，在下对你的敬佩之意有如滔滔江水连绵不绝。
Python-Json
water___Wang: 不错，挺好的，加油~

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

小黄鸭会飞呀 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。