搜索日志记录了从索引获取信息的用户请求。 您可以生成并导出这一信息,然后将其输入喜欢的日志分析软件或报告软件。
下面是搜索日志可提供的信息的一些示例:
- 用户执行了哪些类型的查询?
- 用户点击了用户界面的哪些部分?
- 为用户提供服务的速度如何?
- 用户得到所需结果了吗?
- 您需要通过配置相关查询、关键字匹配、查询扩展或单一框功能帮助用户查找相关信息吗?
您能够在设备中保留最多 100 个覆盖所有集合的搜索日志。
日志的格式是公用日志格式 (Common Log Format, CLF) 的简单扩展。 文件对于每个请求包含单独的一行。 一行由若干个以空格分隔的令牌组成:
主机 — [日期时间] 请求状态字节结果时间
- 主机: 客户机的 IP 地址。
- 日期: 请求的日期和时间,采用以下格式:请求: 来自客户机的请求行,包含在双引号 (“) 内。
- 日期 = [天/月/年:小时:分钟:秒 区域]
- 天 = 2*位数字
- 月份 = 3*个字母
- 年度 = 4*位数字
- 小时 = 2*位数字
- 分钟 = 2*位数字
- 秒 = 2*位数字
- 区域 = (`+’ | `-’) 4*位数字
- 状态: 返回客户端的由三位数字组成的状态代码。
- 字节: 返回到客户端的字节数。
- 结果: 返回到客户端的搜索结果数。
- 时间: 完成此请求所用的总时间(秒)
您可以搜索日志,以查找包含特定字符串的所有行。
请注意: 在指定时区方面,Search Appliance 不再遵循 POSIX 标准。 它采用指定本地时间与格林尼治标准时间差别的时差制。 这样,日本的时区应该指定为 GMT+9,因为它比格林尼治标准时间快 9 个小时。
对日志数据的维护为期 90 天。
“高级搜索报告”中的每个条目表示用户在 Search Appliance 用户界面(搜索页或结果页)上的一次点击。 每个条目由以下项的值组成:
- 以百分之一秒为单位的点击时间
- 做出点击的用户的 IP 地址
- 会话 ID 的占据位置,始终为空
- 点击类型,如下表所述
- 点击起始页(用户点击得到的结果页)
- 点击排名(用户点击得到的结果页的排名)
- 点击数据,通常为空
- 查询(返回结果的用户查询)
- 用户点击的网址
下面的例子显示了高级搜索报告中的一个条目:
121331555476,172.18.75.121, ,onebox,0,0,,hobo,http://www.tropo.com/
下表描述了 Search Appliance 内置的点击类型:
点击类型 | 说明 |
---|---|
高级 | 搜索页上的高级搜索链接 |
advanced_swr | 对其他文字的高级搜索 |
c | 搜索结果 |
缓存 | 结果页上的缓存文档 |
集群 | 结果页上的集群标签 |
db | 结果页上的数据库内容 |
desk.groups | 搜索页顶部的论坛链接 |
desk.images | 搜索页顶部的图片链接 |
desk.local | 搜索页顶部的本地链接 |
desk.news | 搜索页顶部的资讯链接 |
desk.web | 搜索页顶部的网络链接 |
帮助 | 搜索页上的搜索提示链接 |
关键字匹配 | 结果页上的关键字匹配 |
徽标 | 超链接徽标 |
nav.next | 导航,下一页 |
nav.page | 导航,特定页 |
nav.prev | 导航,上一页 |
单一框 | 结果页上的单一框 |
sitesearch | 结果页上的“更多结果来自…链接” |
排序 | 结果页上的排序链接 |
拼写 | 拼写建议 |
同义词 | 结果页上的相关查询 |
其他 | 未注解链接 |
您还可以为前端创建点击类型。 有关详情,请参阅 公共 Search Appliance 文档网页上的“创建搜索体验:最佳实践”。
生成搜索日志:
- 在显示集合搜索日志菜单中,指定您希望涵盖其搜索查询的具体集合。
- 日志的名称最多能包含 20 个字母数字类字符、连字符和下划线。 名称不能以连字符开始。
- 确定内容的具体时间范围。
- 点击生成日志。
虽然设备并不会阻止您创建多个并行的日志,但是建议您最好不要这样做。 为了实现最佳效果,请每次创建一个日志。