大致背景介绍:
两个dataframe对象df1和df2,这两个对象行与列均存在交集,现在想将df1+df2得到df3,期望包含df1和df2中所有行与列,在合并过程中如果行列相同的位置,两个数值相加存放到df3中,擦了~这样文字描述起来好绕脑的感觉,还是画个图大概解释一下吧:
期望df3的结果:
代码上起来:
import pandas as pd
df1=pd.read_csv("D:/snp/test/df1.csv",encoding="gb2312",index_col=0)
df2=pd.read_csv("D:/snp/test/df2.csv",encoding="gb2312",index_col=0)
#注意这里在加载csv的时候直接定义了index_col=0即将csv文件中第一列作为索引列,这一步很重要,否则后面进行add计算的时候会把代码一块给计算了
df3=df1.add(df2,fill_value=0) #fill_value=0用来定义对空值使用0填充
df3.to_csv("d:/snp/test/df3.csv",encoding="utf-8")
如果是不对两个表中的数据进行计算的话,应该用merge()或者concat()命令,暂时没有这个需求,以后用到了再翻文档吧
参考这篇文章总结的不错: