python dataframe 模糊匹配_对dataframe列应用模糊匹配并将结果保存到新列中

我有两个数据帧,每个数据帧有不同的行数。下面是每个数据集的几行df1 =

Company City State ZIP

FREDDIE LEES AMERICAN GOURMET SAUCE St. Louis MO 63101

CITYARCHRIVER 2015 FOUNDATION St. Louis MO 63102

GLAXOSMITHKLINE CONSUMER HEALTHCARE St. Louis MO 63102

LACKEY SHEET METAL St. Louis MO 63102

以及df2 =

FDA Company FDA City FDA State FDA ZIP

LACKEY SHEET METAL St. Louis MO 63102

PRIMUS STERILIZER COMPANY LLC Great Bend KS 67530

HELGET GAS PRODUCTS INC Omaha NE 68127

ORTHOQUEST LLC La Vista NE 68128

我用combined_data = pandas.concat([df1, df2], axis = 1)把它们连在一起。我的下一个目标是使用来自fuzzy wuzzy模块的几个不同的匹配命令将df1['Company']下的每个字符串与df2['FDA Company']下的每个字符串进行比较,并返回最佳匹配的值及其名称。我想把它放在一个新的专栏里。例如,如果我对df1['Company']中的LACKY SHEET METAL执行fuzz.ratio和fuzz.token_sort_ratio操作,则返回的最佳匹配是LACKY SHEET METAL,得分为100,然后将其保存在combined data中的新

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值