第七章对DataFrame行列数据修改的补充，对数据切片的补充

最新推荐文章于 2024-10-15 20:09:10 发布

dark_tone

最新推荐文章于 2024-10-15 20:09:10 发布

阅读量1.5k

点赞数

分类专栏： win32股票统计程序开发文章标签： pandas

本文链接：https://blog.csdn.net/dark_tone/article/details/80179644

版权

win32股票统计程序开发专栏收录该内容

19 篇文章 7 订阅

订阅专栏

#####对第六章补充
#####新增：查询资料后发现，delete方式会改动原始数据，不够安全，所以推荐用drop，这个方法不会修改原始数据，产生一个新对象。
#####新增：添加行列除了用insert之外，如果只需要在最后一行一列添加，完全可以使用append方法，更简单的方法是直接赋值！
对于如下df数据：
这里写图片描述

#添加列
df['人口']=['200','300','400','500','600']

这里写图片描述

#添加行
df.loc[5]={'同比':500,'城市':'月球','定基':500,'环比':500,'人口':'5000'}

这里写图片描述
####在已有的行列上修改数据：

#获取单个数据
df.at[0,'城市']

这里写图片描述

#直接赋值修改数据
df.at[0,'城市']='天津'
#或者用.loc效果一样
df.loc[0,'城市']='天津'

把0行‘城市’列的‘北京’修改成了‘天津’
这里写图片描述

#对已有的行进行修改
df.loc[5]=[600,'火星',1000,1000,50000]

这里写图片描述

#####对第五章的补充
除了第五章论述的那些数据切片方法之外，还能通过“条件筛选”进行切片。
当数据量较多的时候，人工去定位到某些行列再进行切片，虽然也能获得想要的结果，但显然太麻烦，并且容易出错。
pandas无需大量的if语句，就能完成条件筛选切片工作。
比如还是同一个原始df数据，想要获得同比大于120的行。
这里写图片描述

#按照通常想法，是错误写法
df['同比']>120

解释器会明白的告诉我：TypeError: ‘>’ not supported between instances of ‘str’ and ‘int’
df[‘同比’]的dtype明明是float64啊，为什么会是str呢？猜测整个df[‘同比’]被当成str了。

#正确写法
df[df['同比']>120]

这里写图片描述
如果有多个条件，在每项条件之间用括号分隔，再加上逻辑运算符：

#想当然的错误写法
df[120<df['同比']<140]

#正确写法，&不能用and关键字替换
df[(120<df['同比']) & (df['同比']<140)]

这里写图片描述

#####总结：DataFrame数据的切分大概可分为三种方法，第一种是利用行列标签切分，第二种是条件筛选切分，第三种是分组groupby功能。
groupby功能灵活高效，能对数据集进行切片，切块，摘要等操作，我还没学到这，它跟前两种比起来有什么优缺点也不知道，先标记。

dark_tone

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

第七章 对DataFrame行列数据修改的补充，对数据切片的补充

第七章对DataFrame行列数据修改的补充，对数据切片的补充