相同名字比对公式,相似度对比算法_判断两个单位名称相似度-CSDN博客

本文链接：https://blog.csdn.net/super67269/article/details/127245227

本文探讨了公司注册时如何界定名称相似性，并介绍了比对算法在处理百万级数据中的应用，涉及Hadoop分布式系统。文章提到了Excel匹配相似度的计算方法，以及SQL中高效比对字符串相似度的策略。此外，还讨论了在两个大型“0-1”字符串间计算相似度的算法选择，并提到Excel中比对相似度的技巧。最后，文章提及了文本相似度比对在处理两句话意义相似情况下的应用，并简述了数据库查询和序列比对的相关概念。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

公司注册：公司名称相似如何认定？

公司名称相似有两种：名字当中的文字有与其它公司重叠（三个字有两个相同）、不同经营类型的公司名称，比如：“XX市美好家具贸易有限公司”和“XX市美好沐足服务有限公司”属于公司名称相似。

拓展资料：公司注册名称字号重复怎么办公司名称字号如果重复的话是可以进行修改，然后重新选择注册的，不过公司注册名称字号重复并不一定是不能用的，得分辖区，分是不是驰名商标，有没有特别保护。

在登记主管机关辖区内不得与登记注册的同行业企业名称相同或者近似；不在同一省，工商登记机关也不同，是可以用相同的名字的。

除非是驰名商标可以跨地区跨类别进行保护外，其他企业的名称仅仅局限于登记机关辖区和相应的类别内进行保护。

两个公司名称已构成相同且在同一行业内，即违反“申请的字号不得与同一工商行政管理局核准或登记注册的同行企业名称相同，有投资关系的除外”的原则，很可能无法通过名称预先核准。

注册企业时名标相同相近比对规则：第一条：为进一步推进企业名称登记管理改革，建立、完善企业名称比对系统，为申请人提供高效比对服务，依据《企业名称登记管理规定》《企业名称登记管理实施办法》《工商总局关于提高登记效率积极推进：业名称登记管理改革的意见》(工商企注字2017)54号)等制定本规则。

第二条：本规则适用于企业登记机关利用信息化技术，建立、完善企业名称比对系统，为申请人申请企业名称提供比对服务。企业登记机关应当将比对结果以在线网页等方式皇现给申请人，供其参考、选择。

第三条：申请人提交的企业名称登记、核准申请有下列情形之一的，比对系统提示为企业名称相近。(一)与同一企业登记机关已登记、核准的企业名称完全相同。

(二)与同一企业登记机关已登记、核准的企业名称行政区划、字号、行业和组织形式排列顺序不同但文字相同。如：北京红光酒业发展有限公司与红光(北京)酒业发展有限公司。

(三)与同一企业登记机关已登记、核准的企业名称字号、行业文字相同但行政区划或者组织形式不同。第四条：申请人提交的企业名称登记、核准申请有下列情形之一的，比对系统提示为企业名称相近。

(一)与同一企业登记机关已登记、核准的同行业企业名称字号相同，行业表述不同但含义相同。(二)与同一企业登记机关已登记、核准的同行业企业名称字号的字音相同，行业表述相同或者行业表述不同但内容相同。

(三)字号包含同一企业登记机关已登记、核准同行业企业名称字号或者被其包含，行业表述相同或者表述不同但内容相同(四)字号与同一企业登记机关已登记、核准同行业企业名称字号部分字音相同，行业表述相同或者行业述不同但内容相同。

如：北京阿里巴巴科技有限公司与北京马云阿理巴巴科技有限公司、北京阿理巴巴金控技术有限公司。

(五)不含行业表述或者以实业、发展等不使用国民经济行业分类用语表述行业的，包含或者被包含同一企业登记机关已登记、核准的同类别企业名称的字号，或者其字号的字音相同，或者其包含、被包含的部分字音相同。

第五条：申请人通过比对系统查询申请企业名称时，拟申请的企业名称与同一企业登记机关已登记、核准的企业名称相同的，列出相同的企业名称，提示该申请不能通过；拟申请的企业名称与同一企业登记机关已登记、核准的企业名称相近的，列出相近的企业名称清单，提示该申请可以通过，但存在审核不予核准的可能存在虽然核准，但在使用中可能面临侵权纠纷，甚至以不适宜的企业名称被强制变更的风险。

第六条：地方企业登记机关可以根据地方政府要求、改革需要和技术条件等，细化比对规则，不断提高比对智能化服务水平。第七条：农民专业合作社、个体工商户名称和非法人分支机构(营业单位)的比对，参照本规则执行。

第八条：本规则由工商总局解释。

谷歌人工智能写作项目：神经网络伪原创

我做了个相似性的算法，要与数据库上百万比对，其他一些网站都用了Hadoop分布式，知网也是这样的吗？ 50

引言Hadoop分布式文件系统(HDFS)被设计成适合运行在通用硬件(commodity hardware)上的分布式文件系统写作猫。它和现有的分布式文件系统有很多共同点。

但同时，它和其他的分布式文件系统的区别也是很明显的。HDFS是一个高度容错性的系统，适合部署在廉价的机器上。HDFS能提供高吞吐量的数据访问，非常适合大规模数据集上的应用。

HDFS放宽了一部分POSIX约束，来实现流式读取文件系统数据的目的。HDFS在最开始是作为Apache Nutch搜索引擎项目的基础架构而开发的。

HDFS是Apache Hadoop Core项目的一部分。这个项目的地址是。前提和设计目标硬件错误硬件错误是常态而不是异常。

HDFS可能由成百上千的服务器所构成，每个服务器上存储着文件系统的部分数据。我们面对的现实是构成系统的组件数目是巨大的，而且任一组件都有可能失效，这意味着总是有一部分HDFS的组件是不工作的。

因此错误检测和快速、自动的恢复是HDFS最核心的架构目标。流式数据访问运行在HDFS上的应用和普通的应用不同，需要流式访问它们的数据集。HDFS的设计中更多的考虑到了数据批处理，而不是用户交互处理。

比之数据访问的低延迟问题，更关键的在于数据访问的高吞吐量。POSIX标准设置的很多硬性约束对HDFS应用系统不是必需的。为了提高数据的吞吐量，在一些关键方面对POSIX的语义做了一些修改。

大规模数据集运行在HDFS上的应用具有很大的数据集。HDFS上的一个典型文件大小一般都在G字节至T字节。因此，HDFS被调节以支持大文件存储。

它应该能提供整体上高的数据传输带宽，能在一个集群里扩展到数百个节点。一个单一的HDFS实例应该能支撑数以千万计的文件。简单的一致性模型HDFS应用需要一个“一次写入多次读取”的文件访问模型。

一个文件经过创建、写入和关闭之后就不需要改变。这一假设简化了数据一致性问题，并且使高吞吐量的数据访问成为可能。Map/Reduce应用或者网络爬虫应用都非常适合这个模型。

目前还有计划在将来扩充这个模型，使之支持文件的附加写操作。“移动计算比移动数据更划算”一个应用请求的计算，离它操作的数据越近就越高效，在数据达到海量级别的时候更是如此。<