python数据处理常用操作记录

Pandas

1. DataFrame

1.1 新建

可以先新建一个dict,再通过dict直接创建DataFrame

1.2 df.drop()

drop()默认axis=0,即默认删除行,直接传入行的index就行
axis=1删除列

1.3 索引重新排序reset_index()

记得reset_index(drop=True)删除新建的列index

1.4 对于筛选数据时,从DataFrame中选取在列表中存在的值

df[df['教室名称'].isin(list(cr0['房间名称']))]

其中,isin中不能为Series,需要转换为list或其他

1.5 选择行或列

df['A'] # 选择列
df[['A']] # 选择行列

1.6 一列分裂成多列

针对不同处理需求不同操作,这里提供两个相关方法

  1. 第一种方法是Series的split操作,一般数据中有字符分割符时用,如:‘1,2,3,4’
函数
	Series.str.split(pat=None, n=-1, expand=False)
例子
	df = df['attrs'].str.split(',', expand=True)

然后用pd.concat把多列加回

pd.concat([], axis=1, names=new_names)
  1. 第二种方法是用切片自己加上去,注意后面加的str
kb['周'] = kb['课时'].str[0:13]

read_excel读取,把字符串自动转化成了数字

设置参数dtype

read_excel('filepath', dtype={'col_name': str})
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值