linux sphinx 中文分词

1.上传coreseek-3.2.14.tar.gz到用户目录下  
  tar -zxvf coreseek-3.2.14.tar.gz 解压该压缩文件包

2.安装mmseg(中文分词)
  cd coreseek-3.2.14/
  cd mmseg-3.2.14/
  ./configure --prefix=/usr/local/mmseg3
  make && make install 

3.安装coreseek

./configure --prefix=/usr/local/coreseek  --without-unixodbc --with-mmseg-includes=/usr/local/mmseg3/include/mmseg/ --with-mmseg-libs=/usr/local/mmseg3/lib/ --with-mysql-includes=/usr/local/server/mysql/include/ --with-mysql-libs=/usr/local/server/mysql/lib/

make & make install
cd /usr/local/coreseek/etc 
cp sphinx.conf.dist csft.conf  将配置文件改名为csft.conf
 vi csft.conf 打开配置文件 更改配置

source xxxx  主源的名称
{
sql_host =localhost
sql_host =root
sql_host =123
sql_host =xxxx
sql_port =3306
sql_sock =/tmp/mysql.sock
sql_query_pre =SET NAMES utf8
sql_query_pre =SET SESSION query_cache_type=OFF
sql_query_pre =select id,title,flag,post,auth,ip,edtime,hits from table表
sql_query_info =SELECT * FROM table WHERE id=$id
}


#source src1throttled:src1  增量源 全部注释
#{
#
#}

index xxxx 主源索引
{
source =xxxx
path =/usr/local/coreseek/var/data/xxx
docinfo = extern
#stopwords 停词    注释掉
#wordforms 文字格式   注释掉
charset_type=zh_cn.utf-8
charset_dictpath=/usr/local/mmseg/etc/
}

#index test1stemmed:test1   增量索引 全部注释掉
#{
#
#}

#index dist1 分布式索引  全部注释掉
#{
#
#}
indexer  索引生成器  默认就行
{
mem_limit =32M 默认使用内存大小 如果需要可以改大
}
searchd 搜索进程 使用默认
{
}


常用命令:

/usr/local/coreseek/bin/searchd  运行守护进程 

/usr/local/coreseek/bin/searchd --stop 停止服务进程 

/usr/local/coreseek/bin/indexer --all   //创建所有索引

/usr/local/coreseek/bin/indexer index_name  // 创建指定索引

/usr/local/coreseek/bin/search ’关键字搜索‘     //测试搜索





  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值