merge&join&concat
注意:
pandas的merge和数据库中join原理类似
- 在数据是dataframe的时候,join底层调用的是merge,
- concat方法相当于数据库中的全连接(UNION ALL),可以指定按某个轴进行连接,也可以指定连接的方式join(outer,inner 只有这两种),与数据库不同的是concat不会去重,要达到去重的效果可以使用drop_duplicates方法
pandas 读入文件乱码问题
解决pandas读入csv中文乱码问题(encoding各种编码都出错):
- data=open(r’filename’),df=pd.DataFrame(data);如失效采用
- 2.右键复制数据入subline,然后设置编码方式为 utf-8,save文件,然后用pd读入即可