Python Pandas常见用法

最新推荐文章于 2024-07-12 16:16:27 发布

WTRD

最新推荐文章于 2024-07-12 16:16:27 发布

阅读量857

点赞数

分类专栏： Python 文章标签： python 机器学习数据挖掘

本文链接：https://blog.csdn.net/Alleine/article/details/122063428

版权

Python 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

读取数据

CSV

data_frame=pd.read_csv('test.csv',header=None,names=["",""])

参数：

flie path：不带路径可用‘’，带路径注意对/进行转换，使用""，或r’’
header：列名，默认是第一行，None表示不使用第一行
names：自定义列名

合并两个dataframe

dataframe_combined=pd.concat([df1,df2,df3],axis=0)

缺失值

print(df.isna()) #查看缺失值，True/False
print(df.loc[df["any_column_name"].isna(),:]) #查看缺失值
df.dropna(axis=0,how='any',inplace=True) #删除缺失值

查找与提取数据

data_frame_sample=dataframe[dataframe['ID']==ID_number]
data_frame_sample=dataframe[dataframe['ID'].isin([ID_number1,ID_number2])]

变量因子化(as.factor in R)

df["grade"] = df["raw_grade"].astype("category")  #把数据类型转为category
df["grade"].cat.categories  #查看category的所有取值
df["grade"].cat.categories=["a","b","c"]  #为每个category重新赋值

分组处理

dataframe_grouped=dataframe.groupby("group_factor") #根据group_factor分组
dataframe_grouped.get_group("group_name") #提取单独的组
for name,group in dataframe_grouped:     #对每一组进行迭代
	print(name)
	print(group)
dataframe.drop(data_frame_grouped.get_group(name).index) #删除指定group

储存数据

CSV

dataframe.to_csv('test.csv',header=0,index=0,encoding='UTF-8') #header=0不保存列名，index=0不保存行编号

WTRD

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Python Pandas常见用法

目录读取数据PandasCSVNumpy读取数据PandasCSVdata_frame=pd.read_csv('test.csv',header=None,names=["",""])参数：flie path：不带路径可用‘’，带路径注意对/进行转换，使用""，或r’’header：列名，默认是第一行，None表示不使用第一行names：自定义列名Numpy...
复制链接

扫一扫