1.3个表格信息如下
btc = pd.read_csv('./Coinbase_BTCUSD_1h.csv',
skiprows = 1,
usecols = ['Date', 'High', 'Low', 'Volume USD'],
nrows = 5)
btc
eth = pd.read_csv('./Coinbase_ETHUSD_1h.csv',
skiprows = 1,
usecols = ['Date', 'High', 'Low', 'Volume USD'],
nrows = 5)
eth
ltc = pd.read_csv('./Coinbase_LTCUSD_1h.csv',
skiprows = 1,
usecols = ['Date', 'High', 'Low', 'Volume USD'],
nrows = 5)
ltc
2.当设置axis=index时,多个表格会按照索引叠加在一起,有些值其他表格没有的会变成NaN形式。
pd.concat([btc, eth, ltc], axis = 'index')
3.如果不同的表格之间没有之间关系,可以选择添加一个标签,用来对聚合后的表格进行分组时使用,设置 ignore_index = True为生成新的索引。
btc['Type'] = 'Bitcoin'
eth['Type'] = 'Etherium'
ltc['Type'] = 'Litecoin'crypto = pd.concat([btc, eth, ltc],
axis = 'index',
ignore_index = True)
crypto
4. 通过设置表格键值参数,聚合多个表格。使用到参数为keys。
crypto_key = pd.concat([btc, eth, ltc],
axis = 'index',
keys = ['BTC', 'ETH', 'LTC'])
crypto_key
5.在3的基础上,用.reset_index()函数重新设置索引,level代表阶级,按照哪一层索引设置为index。
crypto_key = crypto_key.reset_index(level = [0])
crypto_key
6.set_index()设置多层索引
crypto.set_index(keys = ['Date', 'Type'], inplace = True)
crypto
7.concat()按照列进行聚合表格,axis = 'columns'。
crypto = pd.concat([btc, eth, ltc],
axis = 'columns')
crypto
8.内连接,设置join = 'inner',axis = 'columns'时,只保留共同索引的值。
crypto2 = pd.concat([btc_weird_index, eth, ltc_weird_index],
axis = 'columns',
join = 'inner')
crypto2
8.内连接,设置join = 'inner',axis = 'index'时,只保留共同列的值。
crypto2 = pd.concat([btc_weird_index, eth, ltc_weird_index],
axis = 'index',
join = 'inner')
crypto2