众所周知,关于切词,我们都会联想到jieba分词,如下代码所示:
import jieba
title = ['《创建国际湿地城市工作方案》解读','《关于贯彻落实消防安全责任制实施办法》']
for i in title:
cut = jieba.cut(i)
# print(cut)
# 精确模式
# print('精确模式输出:')
a = ' '.join(cut)
print(a)
得到的结果如下,jieba分词会自动对目标进行精确分词
但是,如果需求是这样的,假设我们现在需要将这两个标题中的废词去除,取出标题中的关键信息,要如何切词呢?
title = ['《创建国际湿地城市工作方案》解读','《关于贯彻落实消防安全责任制实施办法》']
word = ['工作','方案','解读','关于','实施办法']
new_word = []
for i in title:
for j in word:
i = i.replace(j, '')
new_word.append(i)
print(new_word)