php 搜索引擎 分词_php 中文分词 全文搜索引擎 xunsearch 实例

本文档详细介绍了xunsearch的安装、配置过程以及如何使用SCWS进行中文分词。首先,在指定目录下载并解压xunsearch,然后通过执行安装脚本完成安装。接着,配置项目信息和字段类型,创建测试数据表,并使用util工具建立索引。最后,通过util工具进行索引查询,确保系统正常运行。
摘要由CSDN通过智能技术生成

xunsearch 安装

下载

解压

安装

安装成功

配置信息

SCWS 中文分词

设计表

做测试数据

配置文件

建立索引

测试索引

xunsearch 安装

下载

cd  ~/downloads/

wget

%5CUsers%5CADMINI~1%5CAppData%5CLocal%5CTemp%5C%W@GJ%24ACOF(TYDYECOKVDYB.pnghttp://www.xunsearch.com/download/xunsearch-full-latest.tar.bz2

1

2

解压

tar -xvf xunsearch-full-latest.tar.bz2

1

安装

cd xunsearch-full-1.4.11/

./

%5CUsers%5CADMINI~1%5CAppData%5CLocal%5CTemp%5C%W@GJ%24ACOF(TYDYECOKVDYB.pngsetup.sh

1

2

安装成功

+=================================================+

| Installation completed successfully, Thanks you |

| 安装成功,感谢选择和使用 xunsearch              |

+————————————————-+

| 说明和注意事项:                                |

| 1. 开启/重新开启 xunsearch 服务程序,命令如下: |

|    /usr/local/xunsearch/bin/

%5CUsers%5CADMINI~1%5CAppData%5CLocal%5CTemp%5C%W@GJ%24ACOF(TYDYECOKVDYB.pngxs-ctl.sh

restart

|    强烈建议将此命令写入服务器开机脚本中         |

|                                                 |

| 2. 所有的索引数据将被保存在下面这个目录中:     |

|    /usr/local/xunsearch/data

|    如需要转移到其它目录,请使用软链接。         |

|                                                 |

| 3. 您现在就可以在我们提供的开发包(SDK)基础上    |

|    开发您自己的搜索了。                         |

|    目前只支持 PHP 语言,参见下面文档:          |

|    /usr/local/xunsearch/sdk/php/README

+=================================================+

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

配置信息

ini文件设计辅助工具 - 迅搜(xunsearch) - 开源免费中文全文搜索引擎

项目配置详解 - 权威指南 - 迅搜(xunsearch) - 开源免费中文全文搜索引擎

SCWS 中文分词

SCWS|中文分词|PHP中文分词 - 开源免费的中文分词系统

PHP简易中文分词(SCWS) 第4版在线演示 (by hightman)

文档|中文分词|PHP中文分词 - 开源免费的中文分词系统

设计表

CREATE TABLE `test` (

`id` int(11) NOT NULL AUTO_INCREMENT,

`username` varchar(255) COLLATE utf8_unicode_ci NOT NULL,

`mobile` varchar(11) COLLATE utf8_unicode_ci NOT NULL,

`message` text COLLATE utf8_unicode_ci,

PRIMARY KEY (`id`)

) ENGINE=InnoDB AUTO_INCREMENT=10002 DEFAULT CHARSET=utf8 COLLATE=utf8_unicode_ci;

1

2

3

4

5

6

7

做测试数据

先来个1,2百万

配置文件

%5CUsers%5CADMINI~1%5CAppData%5CLocal%5CTemp%5C%W@GJ%24ACOF(TYDYECOKVDYB.pngproject.name

= usersearch

project.default_charset = utf-8

server.index = 8383

server.search = 8384

[id]

type = id

[username]

type = title

[mobile]

index = mixed

; 这里的字段如果参与搜索,一定要加索引

[message]

index = mixed

tokenizer = split

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

建立索引

util/Indexer.php usersearch   –source=mysql://root:root@localhost/yiiExam/ –sql=’select id,username,mobile,message from test’  –clean

1

测试索引

util/Quest.php usersearch 风景

1

注意这里的 usersearch 是项目名称;最好项目名称与配置文件名称一致

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值