linux sphinx,linux下正确安装sphinx-for-chinese中文全文索引

sphinx-for-chinese是一款专注于中文搜索的全文检索软件,在sphinx的基础上添加了中文处理模块并优化了中文搜索效果。

windows上安装sphinx请移步 http://www.tigerbook.cn/article-127.html

#### 准备工作

Linux安装sphinx需要先安装mysql和Gcc和g++支持

```

yum install gcc

yum install g++

```

在linux下,C++的编译器不是g++这个名称,而是gcc-c++,由此看来的确是我想当然了。然后直接运行

```

yum install gcc-c++ libstdc++-devel

```

#### 下载安装

首先下载 sphinx-for-chinese.tar.gz 放在/usr/local 目录下并且解压

```

cd /usr/local

wget http://sphinxsearchcn.github.io/downloads/sphinx-for-chinese-2.2.1-dev-r4311.tar.gz

```

解压之后重命名为sphinxforchinese,进入sphinxforchinese目录开始执行安装

```

tar zxvf sphinx-for-chinese-2.2.1-dev-r4311.tar.gz

cd sphinxforchinese

./configure --prefix=/usr/local/sphinxforchinese --with-mysql

make

make install

```

#### 生成字典

先进入到 /usr/local/sphinxforchinese

1、将文件夹中的 xdict_1.1.txt ([点击下载](http://tigerbook.cn/demo/xdict_1.1.tar.gz "xdict_1.1.tar.gz"))文件丢到 /usr/local/sphinxforchinese目录下

2、执行命令

```

/usr/local/sphinxforchinese/bin/mkdict xdict_1.1.txt etc/xdict

```

成功后发现/usr/local/sphinxforchinese/etc/文件夹中有 xdict代表成功

![linux下正确安装sphinx-for-chinese 中文全文索引教程](/uploads/content/5c1228e047081.png "linux下正确安装sphinx-for-chinese 中文全文索引教程")

#### 建立索引

将 sphinx.conf 丢到 /usr/local/sphinxforchinese/etc 中并且配置数据库连接信息

```

/usr/local/sphinxforchinese/bin/indexer -c /usr/local/sphinxforchinese/etc/sphinx.conf --all --rotate

```

sphinx.conf 文件信息如下

```

source main{

type = mysql

sql_host = 127.0.0.1

sql_user = yourusername #数据库用户名

sql_pass = yourpassword #数据库密码

sql_db = yourdb #使用数据库

sql_port = 3306

sql_sock=/tmp/mysql.sock #mysql文件

sql_query_pre = SET NAMES utf8

sql_query = \

SELECT id, sid,title, img_cover,url_link,updatetime FROM blog_test

sql_attr_uint = sid

sql_attr_timestamp = updatetime

}

source src1throttled : main{

}

index testindex{

source=main

path=/usr/local/sphinxforchinese/data/testindex

charset_type = utf-8

chinese_dictionary = /usr/local/sphinxforchinese/etc/xdict

}

indexer{

mem_limit = 256M

}

searchd

{

listen = 9312

listen = 9306:mysql41

log = /usr/local/sphinxforchinese/log/searchd.log

query_log = /usr/local/sphinxforchinese/log/query.log

read_timeout = 5

max_children = 30

pid_file = /usr/local/sphinxforchinese/log/searchd.pid

seamless_rotate= 1

preopen_indexes= 1

unlink_old = 1

workers = threads # for RT to work

binlog_path = /usr/local/sphinxforchinese/data

}

```

#### 启动sphinx

```

/usr/local/sphinxforchinese/bin/searchd -c /usr/local/sphinxforchinese/etc/sphinx.conf

```

#### 查看是否成功

检查 /usr/local/sphinxforchinese/var/data 中是否有 newindex开头的几个文件

![linux下正确安装sphinx-for-chinese 中文全文索引教程](/uploads/content/5c1229cd6dd6f.png "linux下正确安装sphinx-for-chinese 中文全文索引教程")

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Sphinx 是一个在GPLv2 下发布的一个全文检索引擎,商业授权(例如, 嵌入到其他程序中)需要联系我们(Sphinxsearch.com)以获得商业授权。 一般而言,Sphinx是一个独立的搜索引擎,意图为其他应用提供高速、低空间占用、高结果相关度的全文搜索功能。Sphinx可以非常容易的与SQL数据库和脚本语言集成。 当前系统内置MySQL和PostgreSQL 数据库数据源的支持,也支持从标准输入读取特定格式的XML数据。通过修改源代码,用户可以自行增加新的数据源(例如:其他类型的DBMS 的原生支持)。 搜索API支持PHP、Python、Perl、Rudy和Java,并且也可以用作MySQL存储引擎。搜索API非常简单,可以在若干个小时之内移植到新的语言上。 Sphinx 是SQL Phrase Index的缩写,但不幸的和CMU的Sphinx 目录 1. 简介 1.1. 什么是 Sphinx 1.2. Sphinx 的特性 1.3. 如何获得 Sphinx 1.4. 许可协议 1.5. 作者和贡献者 1.6. 开发历史 2. 安装 2.1. 支持的操作系统 2.2. 依赖的工具 2.3. 安装 Sphinx 2.4. 已知的问题和解决方法 2.5. Sphinx 快速入门教程 3. 建立索引 3.1. 数据源 3.2. 属性 3.3. 多值属性 ( MVA : multi-valued attributes) 3.4. 索引 3.5. 数据源的限制 3.6. 字符集 , 大小写转换 , 和转换表 3.7. SQL 数据源 (MySQL, PostgreSQL) 3.8. xmlpipe 数据源 3.9. xmlpipe2 数据源 3.10. 实时索引 更新 3.11. 索引合并 4. 搜索 4.1. 匹配模式 4.2. 布尔查询 4.3. 扩展查询 4.4. 权值计算 4.5. 排序模式 4.6. 结果分组(聚类) 4.7. 分布式搜索 4.8. searchd 日志格式 5. API 参考 5.1. 通用 API 方法 5.1.1. GetLastError 5.1.2. GetLastWarning 5.1.3. SetServer 5.1.4. SetRetries 5.1.5. SetArrayResult 5.2. 通用搜索设置 5.2.1. SetLimits 5.2.2. SetMaxQueryTime 5.3. 全文搜索设置 5.3.1. SetMatchMode 5.3.2. SetRankingMode 5.3.3. SetSortMode 5.3.4. SetWeights 5.3.5. SetFieldWeights 5.3.6. SetIndexWeights 5.4. 结果集过滤设置 5.4.1. SetIDRange 5.4.2. SetFilter 5.4.3. SetFilterRange 5.4.4. SetFilterFloatRange 5.4.5. SetGeoAnchor 5.5. GROUP BY 设置 5.5.1. SetGroupBy 5.5.2. SetGroupDistinct 5.6. 搜索 5.6.1. Query 5.6.2. AddQuery 5.6.3. RunQueries 5.6.4. ResetFilters 5.6.5. ResetGroupBy 5.7. 额外的方法 5.7.1. BuildExcerpts 5.7.2. UpdateAttributes 6. MySQL 存储引擎 (SphinxSE) 6.1. SphinxSE 概览 6.2. 安装 SphinxSE 6.2.1. 在 MySQL 5.0.x 上 编译 SphinxSE 6.2.2. 在 MySQL 5.1.x 上编译 SphinxSE 6.2.3. SphinxSE 安装测试 6.3. 使用 SphinxSE 7. 报告 bugs 8. sphinx.conf 选项参考 8.1. Data source 配置选项 8.1.1. type 8.1.2. sql_host 8.1.3. sql_port 8.1.4. sql_user 8.1.5. sql_pass 8.1.6. sql_db 8.1.7. sql_sock 8.1.8. mysql_connect_flags 8.1.9. sql_query_pre 8.1.10. sql_query 8.1.11. sql_query_range 8.1.12. sql_range_step 8.1.13. sql_attr_uint 8.1.14. sql_attr_bool 8.1.15. sql_attr_timestamp 8.1.16. sql_attr_str2ordinal 8.1.17. sql_attr_float 8.1.18. sql_attr_multi 8.1.19. sql_query_post 8.1.20. sql_query_post_index 8.1.21. sql_ranged_throttle 8.1.22. sql_query_info 8.1.23. xmlpipe_command 8.1.24. xmlpipe_field 8.1.25. xmlpipe_attr_uint 8.1.26. xmlpipe_attr_bool 8.1.27. xmlpipe_attr_timestamp 8.1.28. xmlpipe_attr_str2ordinal 8.1.29. xmlpipe_attr_float 8.1.30. xmlpipe_attr_multi 8.2. 索引配置选项 8.2.1. type 8.2.2. source 8.2.3. path 8.2.4. docinfo 8.2.5. mlock 8.2.6. morphology 8.2.7. stopwords 8.2.8. wordforms 8.2.9. exceptions 8.2.10. min_word_len 8.2.11. charset_type 8.2.12. charset_table 8.2.13. ignore_chars 8.2.14. min_prefix_len 8.2.15. min_infix_len 8.2.16. prefix_fields 8.2.17. infix_fields 8.2.18. enable_star 8.2.19. ngram_len 8.2.20. ngram_chars 8.2.21. phrase_boundary 8.2.22. phrase_boundary_step 8.2.23. html_strip 8.2.24. html_index_attrs 8.2.25. html_remove_elements 8.2.26. local 8.2.27. agent 8.2.28. agent_connect_timeout 8.2.29. agent_query_timeout 8.2.30. preopen 8.2.31. charset_dictpath 8.3. indexer 程序配置选项 8.3.1. mem_limit 8.3.2. max_iops 8.3.3. max_iosize 8.4. searchd 程序配置选项

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值