sphinx4.2 java设置_sphinx简单配置

最新推荐文章于 2024-04-28 01:13:49 发布

木子Hui

最新推荐文章于 2024-04-28 01:13:49 发布

阅读量195

点赞数

文章标签： sphinx4.2 java设置

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_36057489/article/details/114719238

版权

示例： sphinx.conf 片段:

...

sql_query = SELECT id, title, content, \

author_id, forum_id, post_date FROM my_forum_posts

sql_attr_uint = author_id

sql_attr_uint = forum_id

sql_attr_timestamp = post_date

...

示例：应用程序代码 (PHP):

// only search posts by author whose ID is 123

$cl->SetFilter ( "author_id", array ( 123 ) );

// only search posts in sub-forums 1, 3 and 7

$cl->SetFilter ( "forum_id", array ( 1,3,7 ) );

// sort found posts by posting date in descending order

$cl->SetSortMode ( SPH_SORT_ATTR_DESC, "post_date");

可以通过名字来指示特定的属性，并且这个名字是大小写无关的(注意：直到目前为止，Sphinx还不支持中文作为属性的名称)。属性并不会被全文索引，他们只是按原封不动的存储在索引文件中。

所有文档的ID必须是唯一的无符号非零整数(根据Sphinx构造时的选项，可能是32位或64位)

当建立索引时，Sphinx从指定的数据源获得文本文档，将文本分成词的集合，再对每个词做大小写转换，于是“Abc”，“ABC”和“abc”都被当作同一个词(word，或者更学究一点，词项term)

为了正确完成工作，Sphinx需要知道：

源文本是什么编码的;

那些字符是字母，哪些不是;

哪些字符需要被转换，以及被转换成什么.

这些都可以用

在Coreseek中，启用中文分词后，系统会使用MMSeg内置的码表(被硬编码在MMSeg的程序中)，因此，charset_table在启用分词后将失效。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
sphinx4.2 java设置_sphinx简单配置

示例： sphinx.conf 片段:...sql_query = SELECT id, title, content, \author_id, forum_id, post_date FROM my_forum_postssql_attr_uint = author_idsql_attr_uint = forum_idsql_attr_timestamp = post_date...示例：应用...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。