如图,我需要对某数据进行数据清洗,其中开户行别需要统一,即,中国银行,中国银行股份有限公司,这种实际上是一个行别,需要统一,目前需要把十几万条数据,行别字段进行去重,先看看公共有哪些行别
用到的方法为set
直接用set 也是很快的,我试了一下set 和dict 以秒为单位运行13万数据没有差别,那不如用代码简单的哦
list_bankcode_net=list(set(list(raw_data['开户行'])))
exceFile.sheets.add('本次待遇支付行别'+str(date_today))
exceFile.sheets['本次待遇支付行别'+str(date_today)].range('A1').options(transpose=True).value=list_bankcode_net
最终实现结果如下