Pandas DataFrame常用方法

1、获取列名
1.1.链表推导式
语法:[col for col in df]
返回结果: [‘cvr1’, ‘cvr2’, ‘cvr3’, ‘cvr4’]
结果类型:list
1.2.通过columns属性
columns属性返回Index,
columns.values属性返回 numpy.ndarray,可通过 tolist(), 或者 list(ndarray) 转换为list

print(type(df.columns))
print(type(df.columns.values))
print(type(df.columns.tolist()),":"+"\n",df.columns.tolist())
print(type(df.columns.values.tolist()),":"+"\n",df.columns.values.tolist())

1.3.直接使用 list ,返回一个含有columnsd的list列表

print(list(df))

返回结果: [‘cvr1’, ‘cvr2’, ‘cvr3’, ‘cvr4’]
结果类型:list

2、读取多个文件,合并到一个DataFrame中
2.1 使用通配符读取多个文件

2.2 循环读取单个文件,然后concat到一个DataFrame中

train_data_df = pd.DataFrame()
for train_promotion_tag in promotion_list:
	data_csv = "features_for_{job_type}.csv".format(job_type=job_type)
	print("读取文件{0}".format(data_csv))
	tmp = pd.read_csv(data_csv)
	train_data_df = pd.concat([train_data_df, tmp],ignore_index=True)
  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
Pandas是一个流行的Python数据处理库,在数据处理的过程中,合并数据框是非常常见的操作。在Pandas中,数据框的合并有多个方法,我们可以根据不同的需求和数据类型选择合适的方式进行处理。 Pandas提供的合并方法主要有concat、merge和join。 1. concat方法 concat方法是将多个数据框沿着轴方向进行合并,轴方向可以是行或者列。常用的轴方向是行方向,行方向的合并可以将多个数据框按照行顺序堆叠在一起,成为一个更大的数据框。当然,也可以进行列方向的合并,此时需要保证数据框的行数一致。 语法:pd.concat([df1,df2,df3], axis=0, join='outer') df1,df2,df3表示需要合并的数据框,axis=0表示按照行合并,join='outer'表示合并后的数据框保留所有的行和列。 2. merge方法 merge方法是将多个数据框按照指定的一组或多组键进行合并。例如,我们可以按照某一列(或多列)的值进行合并,类似于SQL中的Join操作。 语法:pd.merge(df1,df2, on='key') df1和df2表示需要合并的数据框,on表示合并的列名。在合并时,列名必须在两个数据框中都存在。 3. join方法 join方法是将多个数据框按照索引进行合并,类似于SQL中的自然连接操作。此时需要保证多个数据框具有相同的索引。 语法:df1.join(df2, how='outer') df1和df2表示需要合并的数据框,how表示合并的方式。默认情况下,how='left'表示按照左侧数据框的索引进行合并,保留左侧数据框的全部行,如果右侧数据框的索引不存在于左侧数据框中,则相应的列填充NaN值。如需要保留所有的行和列,则how='outer'。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值