flashtext 关键字提取

flashtext 关键字提取

flashtext是一个Python库,用于高效地从文本中提取关键字。它提供了一种快速、灵活的方式来搜索和替换文本中的关键词。

要使用flashtext库,首先需要安装它。可以通过以下命令来安装:

pip install flashtext

示例代码

def wordsCheck(text, words):
    # 创建一个 KeywordProcessor 对象
    keyword_processor = KeywordProcessor()
    keyword_processor.add_keywords_from_list(words)
    res = keyword_processor.extract_keywords(text, span_info=True)  # 位置信息
    return [{'word': i[0], 'position': (i[1], i[2])} for i in res]


if __name__ == '__main__':
    text = '这是一个绝无仅有的主意,彻底解决 xxx 问题,保证xxx 绝对'
    words = ['问鼎', '绝无仅有', '业界公认', '彻底解决', '绝对', '之王']
    print(wordsCheck(text, words))

# 返回数据
# [{'word': '绝无仅有', 'position': (4, 8)}, {'word': '彻底解决', 'position': (12, 16)}, {'word': '绝对', 'position': (30, 32)}]

使用flashtext库来查找和替换文本中的关键词:

from flashtext import KeywordProcessor

# 创建一个KeywordProcessor实例
keyword_processor = KeywordProcessor()

# 添加关键词到关键词处理器
keyword_processor.add_keyword('Python', 'Java')
keyword_processor.add_keyword('C++', 'JavaScript')

# 定义一个包含关键词的文本
text = "I love Python and C++ programming."

# 使用replace_keywords方法替换文本中的关键词
new_text = keyword_processor.replace_keywords(text)

print(new_text)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

丢了个猪

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值