lua替换中文_Lua 语言如何替换多个可选字符串

匿名用户

1级

2018-05-31 回答

这个很简单啊,做字符串匹配。关键你那个替换逻辑有点乱。

【匹配整个单词】

一般你在编辑器中做文本替换,要替换所有 【匹配整个单词】 区分大小写 等选项。

你的那个 屏蔽的单词集合,明显分了两类,但却没有区分。

lua my hello go 等式 精确的单词。比如 go 替换 不可能 替换 bingo 中的 go

主题 你好 等是却要替换 一个完整单词(因为匹配一般是靠空格符号匹配的)的一部分。

比如: 替换 "主题" 会把 "主题曲" 中的部分"主题" 替换

【解决方法】先做 包含中文单词匹配,用空格当然有些bug 还是需要解决的,比如常见的 中文符号,要从匹配中 去除,我给你做个简单 demo。

你自己处理下 标点符号。

追问:

多谢回答,以上的替换思路不混乱呀,用其他语言里正则式是可以做到的

比如有个词库包含了    go ,主题曲,my  end  四个子串,不一定是单词哦

把字符串中含有子串的部分替换成 **

现有一句话:我们的主题曲开播了,let`s go,my friends,好吧bingo!

替换后可以为:我们的**开播了,let`s **,**fri**s,好吧bin**!

效果如下图:

是lua的模式串不能这么弄么

追答:

这样不是吧 bingo 这个单词破坏了吗?

我看你的意思也就是 简单搜索下,那这种在lua中就更容易了。

---

-- function maskMsg takes string, table, string returns string

--

-- @text    预处理的文本

-- @set     预搜索的子串集合

--

-- @repl    替换的文本

--          不指定则替换成 与字符串长度相等的 "*"

--

-- @return  处理后的文本

local function maskMsg ( text, set, repl )

if #text <= 0  then

return text

end

local function maskor ( str )

return repl or string.rep( "*", #str )

end

for k, str in pairs(set) do

text = string.gsub( text, str, maskor(str) )

end

return text

end

--  对给定文本中出现的 给定集合中的子串进行替换

text = "lua is my style! hello boy ,let`s go,我们的主题曲! Bingo!"

wordLib = {"lua","my","hello","go","主题","你好"}

local function main ()

local msg = maskMsg ( text, wordLib, "**")

print(msg)

end

main()

--- 输出结果

--  ** is ** style! ** boy ,let`s **,我们的**曲! Bin**!【注:】

【1】上面这个demo 是效率很低很低的方法。

【2】附件:简单屏蔽指定集合中的单词(含中文)- flameleo.lua

--- 输出结果

--  ** is ** style! ** boy ,let`s **,我们的**曲! Bingo!是一个分别处理模式串和非模式串的方法,需要改进中文分词算法

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值