我有缅甸语的文字,UTF-8.我正在使用
PHP来处理文本.在某些时候,一些ZWSP已经悄悄进入,我想删除它们.我尝试了两种不同的方法来删除字符,似乎都没有用.
首先我尝试使用:
$newBody = str_replace("", "", $newBody);
搜索HTML实体并将其删除,因为这是它在Web Inspector下的显示方式.空格不会被删除.我也尝试过:
$newBody = str_replace("", "", $newBody);
并得到相同的没有结果.
看起来像这样:
$newBody = str_replace("\xE2\x80\x8C", "", $newBody);
但我也没有结果. ZWSP未被删除.
An example word in the text ($newBody) looks like this : ယူကရိန်
And I want to make it look like this : ယူကရိန်း
有任何想法吗? preg_replace会以某种方式更好地工作吗?
所以我试过了
$newBody = preg_replace("/\xE2\x80\x8B/", "", $newBody);
它似乎是运作,但现在还有另一个问题.
变成了
我不希望它添加所有额外的东西.任何想法为什么会这样?除了提出某种方法只针对两者之间的文本,还有另一种方法来阻止preg_replace添加所有这些额外的东西?顺便说一句,在Mac上使用谷歌浏览器.似乎与firefox有点不同……