中文公司名称分词工具：companynameparser 使用教程

最新推荐文章于 2024-09-14 08:33:43 发布

马安柯Lorelei

最新推荐文章于 2024-09-14 08:33:43 发布

阅读量976

点赞数 6

本文链接：https://blog.csdn.net/gitblog_00838/article/details/142240176

版权

中文公司名称分词工具：companynameparser 使用教程

companynameparser company name parser, extract company name brand. 中文公司名称分词工具，支持公司名称中的地名，品牌名（主词），行业词，公司名后缀提取。项目地址: https://gitcode.com/gh_mirrors/co/companynameparser

项目介绍

companynameparser 是一个开源的中文公司名称分词工具，旨在从公司名称中提取地名、品牌名、行业词和公司名后缀。该工具支持中文公司名称的解析，能够识别并提取出公司名称中的各个元素，如地名（place）、品牌名（brand）、行业词（trade）和公司名后缀（suffix）。

项目地址：https://github.com/shibing624/companynameparser

项目快速启动

安装

你可以通过以下两种方式安装 companynameparser：

全自动安装

pip install -U companynameparser

半自动安装

git clone https://github.com/shibing624/companynameparser.git
cd companynameparser
python setup.py install

使用示例

以下是一个简单的使用示例，展示了如何从公司名称中提取各个元素：

import companynameparser

company_strs = [
    "武汉海明智业电子商务有限公司",
    "泉州益念食品有限公司",
    "常州途畅互联网科技有限公司合肥分公司",
    "昆明享亚教育信息咨询有限公司"
]

for name in company_strs:
    r = companynameparser.parse(name)
    print(r)

输出结果：

['place': '武汉', 'brand': '海明智业', 'trade': '电子商务', 'suffix': '有限公司', 'symbol': '']
['place': '泉州', 'brand': '益念', 'trade': '食品', 'suffix': '有限公司', 'symbol': '']
['place': '常州 合肥', 'brand': '途畅', 'trade': '互联网科技', 'suffix': '有限公司 分公司', 'symbol': '']
['place': '昆明', 'brand': '享亚', 'trade': '教育信息咨询', 'suffix': '有限公司', 'symbol': '']