pandas下一些值得注意的concat用法

最新推荐文章于 2024-01-16 16:14:58 发布

Ekko285

最新推荐文章于 2024-01-16 16:14:58 发布

阅读量485

点赞数

文章标签： python jupyter

本文链接：https://blog.csdn.net/ekko285/article/details/127934774

版权

1.3个表格信息如下

btc = pd.read_csv('./Coinbase_BTCUSD_1h.csv',
skiprows = 1,
usecols = ['Date', 'High', 'Low', 'Volume USD'],
nrows = 5)
btc

eth = pd.read_csv('./Coinbase_ETHUSD_1h.csv',
skiprows = 1,
usecols = ['Date', 'High', 'Low', 'Volume USD'],
nrows = 5)
eth

ltc = pd.read_csv('./Coinbase_LTCUSD_1h.csv',
skiprows = 1,
usecols = ['Date', 'High', 'Low', 'Volume USD'],
nrows = 5)
ltc

2.当设置axis=index时，多个表格会按照索引叠加在一起，有些值其他表格没有的会变成NaN形式。

pd.concat([btc, eth, ltc], axis = 'index')

3.如果不同的表格之间没有之间关系，可以选择添加一个标签，用来对聚合后的表格进行分组时使用，设置 ignore_index = True为生成新的索引。

btc['Type'] = 'Bitcoin'
eth['Type'] = 'Etherium'
ltc['Type'] = 'Litecoin'

crypto = pd.concat([btc, eth, ltc],
axis = 'index',
ignore_index = True)
crypto

4. 通过设置表格键值参数，聚合多个表格。使用到参数为keys。

crypto_key = pd.concat([btc, eth, ltc],
axis = 'index',
keys = ['BTC', 'ETH', 'LTC'])
crypto_key

5.在3的基础上，用.reset_index（）函数重新设置索引，level代表阶级，按照哪一层索引设置为index。

crypto_key = crypto_key.reset_index(level = [0])
crypto_key

6.set_index（）设置多层索引

crypto.set_index(keys = ['Date', 'Type'], inplace = True)
crypto

7.concat（）按照列进行聚合表格，axis = 'columns'。

crypto = pd.concat([btc, eth, ltc],
axis = 'columns')
crypto

8.内连接，设置join = 'inner'，axis = 'columns'时，只保留共同索引的值。

crypto2 = pd.concat([btc_weird_index, eth, ltc_weird_index],
axis = 'columns',
join = 'inner')
crypto2

8.内连接，设置join = 'inner'，axis = 'index'时，只保留共同列的值。

crypto2 = pd.concat([btc_weird_index, eth, ltc_weird_index],
axis = 'index',
join = 'inner')
crypto2

Ekko285

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫