Pandas 数据处理的基本方法

最新推荐文章于 2024-07-10 22:57:36 发布

尘埃里的邂逅

最新推荐文章于 2024-07-10 22:57:36 发布

阅读量267

点赞数

分类专栏：人生苦短，我学python 文章标签： Pandas 基本操作

本文链接：https://blog.csdn.net/qq_42811161/article/details/90084730

版权

人生苦短，我学python 专栏收录该内容

17 篇文章 0 订阅

订阅专栏

import pandas as pd，其中pd.Series()类似与python中的字典，可传入字典构造。支持相应的切片，若切片值为index则前后区间都包括在内：d[“123”]或者d[" “:” “]表示两个index之前的全部数，显示索引；若是数字切片，d[0:2]贼左闭右包，隐式索引。
在这里插入图片描述
np.DataFrame()类似于两个Series进行叠加，行列都有索引。m=np.DataFrame({” 45":d})(d为一个Series)其中，m.index放回行的标签，m.colums返回列的标签。其中m[“col0”]返回第一列的值，m[0]在数组中则是返回第一个数的值。其中，某些键的之不存在，pd会自动补充NaN。或者时pd.DtaFrame(二维数组，[index=[],clunms=[]])也可以创建DataFrame数组形式。
ind=np.Index()可以构造出index的数组，与numpy的array类似，唯一区别就是不要变ind[1]=2,就会报错。
pd可以像字典一样改变值或者输出：d.keys(),d.items()d[“56”]=12

操作时：loc取值和索引都是显示；iloc取值和索引都是隐式。
DataFrame数据选择方法：
data[index]#索引;data.index#属性值
data.values#看成数组进行按行查看数组数据,返回一个二维数组，然后就可以按照数组进行操作
可以直接使用掩码，对数据直接进行过滤:data[data[“index”]>100],可以与numpy结合使用，运用通用函数。
df=pd.DataFrame() df.add(),df.mul()/df.multiply(),df.sub()/df.subtract(),df.mod(),df.pow()与numpy中的运算相对应。
pands对缺失值的处理：
None：类型，object类型
NaN:数值型缺失值，任何操作的结果都为NaN。
isnull(),notnull()进行判断。
data.isnull()#返回对应位上的true与false,data[data.notnull()]#返回非空的数据
剔除缺失值：
data.dropna()#默认提出包含nan的一整行数据，也可以填进去参数：data.dropna(axis= ,how=“any”/“all”,thresh=)
data.fillna()#对缺失值进行填充np.DataFrame( ‘’’’’’’,fill_value=0)也可以进行填充data.fillna(method=“ffill"or"bfill”)#ffill:利用前面的值进行填充；bfill:利用从后往前的值进行填充。
多级索引：MultiIndex----data.unstack()#将多级索引快速变为普通DataFrame数据结构
data.stack()#将行列索引的DataFrame快速变为一个多级索引
data.groupby(" “)#返回一个groupby对象，可以认为其为一个DataFrame
高性能运算：
pd.eval(” ")#算术运算、比较运算。。。。。括号里面需要在引号中进行，字符进行

尘埃里的邂逅

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Pandas 数据处理的基本方法

import pandas as pd，其中pd.Series()类似与python中的字典，可传入字典构造。支持相应的切片，若切片值为index则前后区间都包括在内：d[“123”]或者d[" “:” “]表示两个index之前的全部数，显示索引；若是数字切片，d[0:2]贼左闭右包，隐式索引。np.DataFrame()类似于两个Series进行叠加，行列都有索引。m=np.DataFra...
复制链接

扫一扫

专栏目录