coreseek检索时全角字符对全文检索质量的影响

近来试用一段时间后,发现一些全角字符,尤其是双引号,书名号对英文的影响有些严重.

比如搜索PHP时,出来的前几条中都没有PHP词样.经过一段时间观察,发现这些出现异常的内容里,都带有这些全角符号.

李沫南说其它应用网站未发现这个状态.但我这儿两台测试机都已发生此现象.

详细内容还得观察一段时间.目前只能暂时将全角符号在数据源上做转换.(亦可用pythone数据源在提供给sphinx时做转换).

如有相同故障的同学亦可暂时试用此法.

附,另有一法.可以设置stopwords,在停用词表中加入符号字符

另.coreseek的B2版,API中Setweidht有故障无法使用,需升级到B3或B4.

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值