python_从文本中找到部分关键词,生成两个列表

有一段文本,new_text = “你好,北京河北山西山东济南”,highlight_words = [“你好”, “河北”, “山西”],想要挨个从文本中找到该关键词并标红处理。

new_text = "你好,北京河北山西山东济南"
highlight_words = ["你好", "河北", "山西"]

# 处理每一个词
current_word = ''
i = 0
highlighted_parts = []
normal_parts = []

if len(highlight_words)!=0:
    while i < len(new_text):
        # print(f'---{new_text[i:]}')
        found_highlight = False
        for word in highlight_words:
            if new_text[i:].startswith(word):
                # 如果词在高亮列表中,则记录下来
                if current_word:  # 如果当前有普通文本,先记录
                    normal_parts.append(current_word)
                    current_word = ''
                highlighted_parts.append(word)
                i += len(word)
                # print(f'找到后的i:{i}')
                found_highlight = True
                break
        if not found_highlight:
            if i == len(new_text) - 1:  # 如果是最后一个字符,则记录下来
                # print("满足了这个条件")
                # print(current_word)
                if current_word:
                    normal_parts.append(current_word+new_text[i])
                break
            else:
                current_word += new_text[i]
                # print(f'current_word:{current_word}')
                i += 1
                # print(f'i:{i}')
else:
    normal_parts=[new_text]

print(normal_parts)
print(highlighted_parts)
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值