关于应用python以及正则解决公司对应行业的字段匹配的问题

本文介绍如何利用Python和正则表达式解决不完全匹配的公司名称与行业字段的匹配问题。作者面对的问题是,表1的公司名称比表2的长,存在括号等额外信息。通过数据导入、正则匹配、去重和删除不必要的记录,成功将表1的公司名称与表2的行业匹配起来。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

关于应用python以及正则解决公司对应行业的字段匹配的问题


本人一小白,初入江湖,就遇到一让人崩掉的问题。入正题:

#1、问题:

表1中只有公司名,而表2中有公司名和行业,我想像excel的vlookup函数一样,通过表2v出表1的公司名所对应的行业。

#2、数据查看

我这里有两个表,表1只有一列,字段为公司名,如图:
在这里插入图片描述
表2 中包含2列,字段为公司名和行业,如图:
在这里插入图片描述
**注意:**但是仔细查看,会发现存在一个问题,表2中的公司名的字段和表1中的公司名的字段并不完全匹配,比如:
表1中的公司名为“思科涡旋科技(杭州)有限公司”,而表2中的公司名为“思科科技有限公司”。
那么问题出现了,我怎么将两个表中两个不完全相同的字段进行匹配,并还能找出公司名所对应的行业呢?
(我们先不考虑,字符并不完全匹配的公司是否在实际上是一家公司,假设为一家公司,例如:思科涡旋科技(杭州)有限公司”和“思科科技有限公司”为一家公司

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值