python| 一些细碎知识点记录

本文介绍了如何使用Pandas库在Python中处理DataFrame,包括ExcelWriter写入多表、日期类型转换、数据清洗(处理缺失值和重复行)、以及数据合并和格式转换等操作,还提及了CSV和JSON文件的读写技巧。
摘要由CSDN通过智能技术生成

# 假定你已经有两个DF数据块:df1和df2             excel写入多个文件的处理方法(写入每一个表格时,不要覆盖上一个表格)
writer = pd.ExcelWriter(保存路径)                       https://www.zhihu.com/tardis/zm/art/344864715?source_id=1005   
df1.to_excel(writer, sheet_name='sheet1')
df2.to_excel(writer, sheet_name='sheet2')
writer.save() 


pd.to_datetime(data.date)    将日期列转化为日期格式






重点学习:
Ctrl+Z              撤回


read_json(path)     读取json文件

any(titanic.Age.isnull())    检查数据表的某一列是否有缺失

titanic.dropna(subset=['Age'], inplace=True)  不妨删除含有缺失年龄的观察,注意这里应用了inplace之后,原数据直接被改动了


explode       【列传行功能】如果explode时,[]或{}里面有重复值,可以跟一个去重的操作(即如果爆炸之后的数据出现重复行,可以跟一个去重的操作)
                             df.explode('爱好').drop_duplicates()


data.duplicated()            检验重复值(行之间是否重复,返回每一行的True False)
data.duplicated(keep=False)  提取重复行
data.drop_duplicates()       删去重复行
 
                            详细介绍可以参见csdn收藏里的文章https://blog.csdn.net/yuxiaosmd/article/details/114647974



dropna(subset=[''])           删除空值,注意当加上参数subset之后,是针对那一列的空值

drop(columns=[''])            删除某列

drop(data[写条件].index)      删除满足某些条件的行

data[''].values.tolist()      将某一列{}格式的数据转成dataframe表格式

pd.concat(['',''])               表拼接

data[''].nunique()            查看数据列中有多少不同的值


data[  写多个条件   ]         【多条件筛选】注意,当多个条件时,注意彼此之间是 & | 哪个关系。

                                            筛选包含某个字符用      data[''].str.contains('字符')
                                            筛选不包含某个字符用   ~data[''].str.contains('字符')
                                                                                                  还要注意要不要用'[]'括起来字符条件

data[''].isin()               筛选

data[''].astype()             转化某列的数据类型

.str.lower()                  将字符串改为小写

.str.replace('满足条件的字符','')   将某些字符删去

.str.strip(' ')               删去字符串前后的空格


data[''].apply()              对某列使用函数方法,apply后面可跟自定义的函数方法,也可以跟系统自带的函数,或者lambda匿名函数

结果1 if 条件1 else 结果2     三目运算


data.to_csv(path,sep=',',index=False,header=True,encoding='utf-8-sig')    写入csv文件

data.to_excel(path,index=False,header=False)         写入excel表格,不加索引不加列名(直接写入)

pd.read_csv(path)             读取csv文件,间隔符是','


pd.merge(data1,data2,on=['',''],how='',suffixes=('',''))     表格两两横向拼接,可以选择在哪一列(或哪几列)的基础上拼接,也可以修改后缀名,默认是_x _y


round(结果,3)                 结果保留3位小数

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值