pandas数据规整化

merge函数的参数

left     #参与合并的左侧的DataFrame
----------------------------------------------------------------
right   #参与合并的右侧DataFrame
----------------------------------------------------------------
how   #"inner"取交集,"outer"取并集,"left"以左left_on为选,"right"。默认为"inner"
----------------------------------------------------------------
on  #用于连接的列名。必须存在于左右两个DataFrame对象中。如果未指定,且其他连接键也未指定,则以left和right列名的交集作为连接键
----------------------------------------------------------------
left_on   #左侧DataFrame中用作连接键的列
----------------------------------------------------------------
right_on   #右侧DataFrame中用作连接键的列
----------------------------------------------------------------
left_index   #将左侧后行索引用作其连接键,默认为False
----------------------------------------------------------------
right_index    #类似于left_index
----------------------------------------------------------------
sort     #根据连接键对合并后的数据进行排序,默认为True,有时在处理大数据集时,禁用该选项可获得更好的性能
----------------------------------------------------------------
suffixes    #字符串值选组,用于追加到重叠列名的末尾,默认为("_x","_y")。例如,如果左右两个DataFrame对象都有"data",则结果中就会出现"data_x"和"data_y"
----------------------------------------------------------------
copy     #设置为False,可以在某些特殊情况下避免将数据复制到结果数据结构中。默认总是复制

concat函数的参数

objs     #参与连接的pandas对象的列表或字典。唯一必须的参数
----------------------------------------------------------------
axis    #指明连接的轴向,默认为0
----------------------------------------------------------------
join    #"inner","outer"其中之一,默认为"outer",指明其他轴向上的索引是按交集(inner)还是并集(outer)进行合并
----------------------------------------------------------------
join_axes   #指明用于其他n-1条轴的索引,不执行并集/交集运算
----------------------------------------------------------------
keys   #与连接对象有关的值,用于形成连接轴向上的层次化索引。可以是任意值的列表或数组、元组数组、数组列表(如果将level设置成多级数组的话)
----------------------------------------------------------------
levels   #指定用作层次化索引各级别上的索引,如果设置了外层级别的索引的话(keys)
----------------------------------------------------------------
names   #用于常见分层级别的名称,如果设置了keys和(或)levels的话
----------------------------------------------------------------
verify_integrity   #检查结果对象新轴上的重复情况,如果发现则引发异常。默认(False)允许重复
----------------------------------------------------------------
ignore_index   #不保留连接轴上的索引,产生一组新索引range(total_length)
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值