# 假定你已经有两个DF数据块:df1和df2 excel写入多个文件的处理方法(写入每一个表格时,不要覆盖上一个表格)
writer = pd.ExcelWriter(保存路径) https://www.zhihu.com/tardis/zm/art/344864715?source_id=1005
df1.to_excel(writer, sheet_name='sheet1')
df2.to_excel(writer, sheet_name='sheet2')
writer.save()
pd.to_datetime(data.date) 将日期列转化为日期格式
重点学习:
Ctrl+Z 撤回
read_json(path) 读取json文件
any(titanic.Age.isnull()) 检查数据表的某一列是否有缺失
titanic.dropna(subset=['Age'], inplace=True) 不妨删除含有缺失年龄的观察,注意这里应用了inplace之后,原数据直接被改动了
explode 【列传行功能】如果explode时,[]或{}里面有重复值,可以跟一个去重的操作(即如果爆炸之后的数据出现重复行,可以跟一个去重的操作)
df.explode('爱好').drop_duplicates()
data.duplicated() 检验重复值(行之间是否重复,返回每一行的True False)
data.duplicated(keep=False) 提取重复行
data.drop_duplicates() 删去重复行
详细介绍可以参见csdn收藏里的文章https://blog.csdn.net/yuxiaosmd/article/details/114647974
dropna(subset=['']) 删除空值,注意当加上参数subset之后,是针对那一列的空值
drop(columns=['']) 删除某列
drop(data[写条件].index) 删除满足某些条件的行
data[''].values.tolist() 将某一列{}格式的数据转成dataframe表格式
pd.concat(['','']) 表拼接
data[''].nunique() 查看数据列中有多少不同的值
data[ 写多个条件 ] 【多条件筛选】注意,当多个条件时,注意彼此之间是 & | 哪个关系。
筛选包含某个字符用 data[''].str.contains('字符')
筛选不包含某个字符用 ~data[''].str.contains('字符')
还要注意要不要用'[]'括起来字符条件
data[''].isin() 筛选
data[''].astype() 转化某列的数据类型
.str.lower() 将字符串改为小写
.str.replace('满足条件的字符','') 将某些字符删去
.str.strip(' ') 删去字符串前后的空格
data[''].apply() 对某列使用函数方法,apply后面可跟自定义的函数方法,也可以跟系统自带的函数,或者lambda匿名函数
结果1 if 条件1 else 结果2 三目运算
data.to_csv(path,sep=',',index=False,header=True,encoding='utf-8-sig') 写入csv文件
data.to_excel(path,index=False,header=False) 写入excel表格,不加索引不加列名(直接写入)
pd.read_csv(path) 读取csv文件,间隔符是','
pd.merge(data1,data2,on=['',''],how='',suffixes=('','')) 表格两两横向拼接,可以选择在哪一列(或哪几列)的基础上拼接,也可以修改后缀名,默认是_x _y
round(结果,3) 结果保留3位小数
python| 一些细碎知识点记录
最新推荐文章于 2024-10-18 00:00:00 发布
本文介绍了如何使用Pandas库在Python中处理DataFrame,包括ExcelWriter写入多表、日期类型转换、数据清洗(处理缺失值和重复行)、以及数据合并和格式转换等操作,还提及了CSV和JSON文件的读写技巧。
摘要由CSDN通过智能技术生成