python dataframe 模糊匹配_对dataframe列应用模糊匹配并将结果保存到新列中

最新推荐文章于 2022-03-02 10:11:24 发布

weixin_39698217

最新推荐文章于 2022-03-02 10:11:24 发布

阅读量2.4k

点赞数

文章标签： python dataframe 模糊匹配

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39698217/article/details/111864611

版权

我有两个数据帧，每个数据帧有不同的行数。下面是每个数据集的几行df1 =

Company City State ZIP

FREDDIE LEES AMERICAN GOURMET SAUCE St. Louis MO 63101

CITYARCHRIVER 2015 FOUNDATION St. Louis MO 63102

GLAXOSMITHKLINE CONSUMER HEALTHCARE St. Louis MO 63102

LACKEY SHEET METAL St. Louis MO 63102

以及df2 =

FDA Company FDA City FDA State FDA ZIP

LACKEY SHEET METAL St. Louis MO 63102

PRIMUS STERILIZER COMPANY LLC Great Bend KS 67530

HELGET GAS PRODUCTS INC Omaha NE 68127

ORTHOQUEST LLC La Vista NE 68128

我用combined_data = pandas.concat([df1, df2], axis = 1)把它们连在一起。我的下一个目标是使用来自fuzzy wuzzy模块的几个不同的匹配命令将df1['Company']下的每个字符串与df2['FDA Company']下的每个字符串进行比较，并返回最佳匹配的值及其名称。我想把它放在一个新的专栏里。例如，如果我对df1['Company']中的LACKY SHEET METAL执行fuzz.ratio和fuzz.token_sort_ratio操作，则返回的最佳匹配是LACKY SHEET METAL，得分为100，然后将其保存在combined data中的新

最低0.47元/天解锁文章

weixin_39698217

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python dataframe 模糊匹配_对dataframe列应用模糊匹配并将结果保存到新列中

我有两个数据帧，每个数据帧有不同的行数。下面是每个数据集的几行df1 =Company City State ZIPFREDDIE LEES AMERICAN GOURMET SAUCE St. Louis MO 63101CITYARCHRIVER 2015 FOUNDATION ...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。