mysql 去掉html_在MySQL全文搜索中忽略&符号的HTML实体

我有很多数据正在使用HTML实体& amp;进入记录.对“amp”一词的全文搜索将导致包含& amp; amp;显示,这是非常不受欢迎的.

大概这是因为MySQL忽略了’&’和’;’.因此,有人知道MySQL中的任何方式强制它将特殊字符作为单词的一部分处理,以便我对“amp”的搜索不包括& amp;的所有结果.在它们中 – 理想情况下没有某种形式的子查询或额外的WHERE子句?

到目前为止我的解决方案(尚未实现)是在INSERT上解码实体并在Web上显示时重新编码它们.这样可以,但如果可能的话,我会尽量避免一些开销.它也适用于新条目,但我需要将它回溯到近700万条记录……如果我能帮助它,我有点不想做.

我用以下内容更新了my.cnf文件:

ft_stopword_file = /etc/mysql/custom-stopwords

是否需要对此文件有任何特殊权限?

解决方法:

你的“在INSERT上解码HTML实体并在输出上对它们进行编码”是你最好的选择,它会照顾像& quot;同样.您可能希望在此过程中删除HTML标记,以防止MySQL在属性值中查找内容.

如果速度和格式是一个问题,那么你可以将text / plain版本填充到一个单独的列中,并将全文索引放在其中,让其他所有内容使用text / html版本.当然,您必须同时维护两个列,并且您的存储要求会上升; OTOH,这种方法可以让您在索引中添加标签,作者姓名和其他额外的有趣数据,而不会弄乱您显示的文本.

同时,在将ft_stopword_file添加到配置文件后,是否重建了全文索引? AFAIK,在进入索引的途中应用了停用词,而不是在查阅索引时应用.

标签:mysql,html-entities,full-text-search

来源: https://codeday.me/bug/20190705/1383738.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值