01 前言
这是「罗罗攀」的又一个新系列文章,依照惯例,还是说明下开启这个新系列文章的初衷和原因吧。
在我的工作中,虽然大分部情况可以不通过编程来完成,但是有些重复或者烦琐的问题,通过编程可以很快速的完成,提高工作效率。这个系列可能包括的有Python+文件批量处理,Python+office高效办公,Python+ArcGIS专业等。
由于自己也在不断学习和探索中,可能有些代码并不是最优化的,也不一定是最实用的。但希望通过这个系列,不断记录自己的学习过程,同时给各位读者提供一些新思路。
02 问题描述
这来源于一个同事问的问题,他有两个表格,第一个表格是总表,但是有一列数据部分内容是写错了的。正确的内容写在了另外一个表格中。
03 解决代码
虽然可以用Excel解决,但是Python代码很快就能搞定,解决步骤如下。
① 读入数据
old_df = pd.read_excel('批量替换缺失值.xlsx',sheetname='1')
new_df = pd.read_excel('批量替换缺失值.xlsx',sheetname='2')
② 合并两个表格数据
df = pd.merge(old_df,new_df,on='姓名',how='outer')
df
③ 填充缺失值
df['爱好_y'].fillna(df['爱好_x'],inplace=True)
④ 最后保留爱好_y这一列数据就行了,导出数据就完成了
总结
这就是巧用数据合并来解决问题的方法和思路,大家有什么更好的方法可以留言告诉我哦~