Pandas 学习记录二
本节主要学习pandas中的重命名、拼接
1、重命名 rename()
改变索引或者列名,如:将列名 points 改为 score
reviews.rename(columns={'points':'score'})
改变索引
reviews.rename(index={0:'firstEntry', 1:'secondEntry'})
重命名索引的另一种常用方法 rename_axis()
reviews.rename_axis("wines", axis='rows').rename_axis('field', axis='columns')
2、连接
主要有 concat()、join()、merge(),但大多数情况下 merge() 的功能可由 join()实现,故只介绍前两种。
**concat()**比较简单,将有相同区域的不同表拼成一个
canadian_youtube = pd.read_csv("../CAvideos.csv")
british_youtube = pd.read_csv("../GBvideos.csv")
pd.concat([canadian_youtube, british_youtube])
**join()**与SQL中的连接类似
df.join(other, on=None, how='left', lsuufix=", rsuffix=", sort=False)
参数解释:
- other:另一张表(右表)
- on:列名称,默认索引链接
- how:连接方式,默认左连接
- lsuffix:str类型,重复列左表后缀
- rsuffix:str类型,重复列右表后缀
- sort:bool类型,
left = canadian_youtube.set_index(['title', 'trending_date'])
right = british_youtube.set_index(['title', 'trending_date'])
left.join(right, lsuffix='_CAN', rsuffix='_UK')