pandas下一些值得注意的concat用法

 1.3个表格信息如下

btc = pd.read_csv('./Coinbase_BTCUSD_1h.csv', 
                  skiprows = 1, 
                  usecols = ['Date', 'High', 'Low', 'Volume USD'],
                  nrows = 5)
btc

 

 eth = pd.read_csv('./Coinbase_ETHUSD_1h.csv', 
                  skiprows = 1, 
                  usecols = ['Date', 'High', 'Low', 'Volume USD'],
                  nrows = 5)
eth

 

 ltc = pd.read_csv('./Coinbase_LTCUSD_1h.csv', 
                  skiprows = 1, 
                  usecols = ['Date', 'High', 'Low', 'Volume USD'],
                  nrows = 5)
ltc

 

 2.当设置axis=index时,多个表格会按照索引叠加在一起,有些值其他表格没有的会变成NaN形式。

pd.concat([btc, eth, ltc], axis = 'index')   

 3.如果不同的表格之间没有之间关系,可以选择添加一个标签,用来对聚合后的表格进行分组时使用,设置 ignore_index = True为生成新的索引。

btc['Type'] = 'Bitcoin'
eth['Type'] = 'Etherium'
ltc['Type'] = 'Litecoin'

crypto = pd.concat([btc, eth, ltc], 
                   axis = 'index',
                   ignore_index = True)
crypto

 

 

4. 通过设置表格键值参数,聚合多个表格。使用到参数为keys。

crypto_key = pd.concat([btc, eth, ltc], 
                       axis = 'index',
                       keys = ['BTC', 'ETH', 'LTC'])
crypto_key

 5.在3的基础上,用.reset_index()函数重新设置索引,level代表阶级,按照哪一层索引设置为index。

crypto_key = crypto_key.reset_index(level = [0])
crypto_key

 

6.set_index()设置多层索引

crypto.set_index(keys = ['Date', 'Type'], inplace = True)
crypto

 

 7.concat()按照列进行聚合表格,axis = 'columns'。

crypto = pd.concat([btc, eth, ltc], 
                   axis = 'columns')
crypto

 

 8.内连接,设置join = 'inner',axis = 'columns'时,只保留共同索引的值。

 crypto2 = pd.concat([btc_weird_index, eth, ltc_weird_index], 
                   axis = 'columns',
                   join = 'inner')
crypto2

 

 8.内连接,设置join = 'inner',axis = 'index'时,只保留共同列的值。

 crypto2 = pd.concat([btc_weird_index, eth, ltc_weird_index], 
                   axis = 'index',
                   join = 'inner')
crypto2

 

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
pandasconcat函数可以用于将多个数据集按照一定的方式进行合并,常用的合并方式有“行拼接”和“列拼接”。 行拼接: ```python import pandas as pd # 构造数据集 df1 = pd.DataFrame({'A': ['A0', 'A1', 'A2', 'A3'], 'B': ['B0', 'B1', 'B2', 'B3'], 'C': ['C0', 'C1', 'C2', 'C3'], 'D': ['D0', 'D1', 'D2', 'D3']}) df2 = pd.DataFrame({'A': ['A4', 'A5', 'A6', 'A7'], 'B': ['B4', 'B5', 'B6', 'B7'], 'C': ['C4', 'C5', 'C6', 'C7'], 'D': ['D4', 'D5', 'D6', 'D7']}) df3 = pd.DataFrame({'A': ['A8', 'A9', 'A10', 'A11'], 'B': ['B8', 'B9', 'B10', 'B11'], 'C': ['C8', 'C9', 'C10', 'C11'], 'D': ['D8', 'D9', 'D10', 'D11']}) # 行拼接 row_concat = pd.concat([df1, df2, df3], axis=0) print(row_concat) ``` 输出: ``` A B C D 0 A0 B0 C0 D0 1 A1 B1 C1 D1 2 A2 B2 C2 D2 3 A3 B3 C3 D3 0 A4 B4 C4 D4 1 A5 B5 C5 D5 2 A6 B6 C6 D6 3 A7 B7 C7 D7 0 A8 B8 C8 D8 1 A9 B9 C9 D9 2 A10 B10 C10 D10 3 A11 B11 C11 D11 ``` 列拼接: ```python import pandas as pd # 构造数据集 df1 = pd.DataFrame({'A': ['A0', 'A1', 'A2', 'A3'], 'B': ['B0', 'B1', 'B2', 'B3'], 'C': ['C0', 'C1', 'C2', 'C3'], 'D': ['D0', 'D1', 'D2', 'D3']}) df2 = pd.DataFrame({'E': ['E0', 'E1', 'E2', 'E3'], 'F': ['F0', 'F1', 'F2', 'F3'], 'G': ['G0', 'G1', 'G2', 'G3'], 'H': ['H0', 'H1', 'H2', 'H3']}) # 列拼接 col_concat = pd.concat([df1, df2], axis=1) print(col_concat) ``` 输出: ``` A B C D E F G H 0 A0 B0 C0 D0 E0 F0 G0 H0 1 A1 B1 C1 D1 E1 F1 G1 H1 2 A2 B2 C2 D2 E2 F2 G2 H2 3 A3 B3 C3 D3 E3 F3 G3 H3 ``` 在行拼接和列拼接时,需要指定`axis`参数,`axis=0`表示行拼接,`axis=1`表示列拼接。同时,需要注意数据集在拼接时,列名或索引名需要对齐,否则会出现缺失值。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值