1.接口api:
1-1.基于oltp的查询
1-1-1.接口的的形式 (sql子集 or json封装 or 两者都有)
1-1-2.具体实现细节需详细考虑
(以上功能主要是用于满足oltp的crud功能,现阶段公司的业务组需要支持这些)
1-2.基于搜索的查询(自定义josn封装)
1-2-1.主搜索接口(该接口用于实现标准的搜索功能)
1-2-2.下拉提示接口
1-2-3.相关搜索接口(改接口也可并入到第一个接口中,目前分开设计,主要用于一些近义词、相关词的结果展示)
1-2-4.拼音纠错接口
1-3.基于nlp的功能接口()
1-3-1.中文分词
1-3-2.词性标注
"周杰伦出生于台湾,生日为79年1月18日,他曾经的绯闻女友是蔡依林。"
周杰伦/人名 出生/动词 于/介词 台湾/地名 ,/标点 生日/名词 为/介词 79年/时间短语 1月/时间短语 18日/时间短语 ,/标点 他/人称代词 曾经/副词 的/结构助词 绯闻/名词 女友/名词 是/动词 蔡依林/人名 。/标点
1-3-3.实体名识别
"詹姆斯·默多克和丽贝卡·布鲁克斯 鲁珀特·默多克旗下的美国小报《纽约邮报》的职员被公司律师告知,保存任何也许与电话窃听及贿赂有关的文件。"
{詹姆斯·默多克=人名, 鲁珀特·默多克旗=人名, 丽贝卡·布鲁克斯=人名, 纽约=地名, 美国=地名}
1-3-4.应用:自动问答、文本蕴涵、机器翻译
2.管理界面:
2-1.索引配置(与表结构配置相似)
2-2.违禁词、近义词等基础配置;
2-3.黑白名单配置
2-4.等等
3.分析界面:
3-1.搜索热词分析;
3-2.搜索效果评估分析;
(二和三也可统一成一个)
4.持久层:
4-1.elasticsearch(第一版应该先基于这个去做,之后的可以丰富起来)
4-1-1.集群的详细性能测试;
4-1-2.权限(数据安全)、监控的增加;
4-1-3.docker化,减少运营压力;
4-1-4.源码分析(这个的优先级并非最低,可与上述内容并行)
4-2.上面很多功能es可能无法解决,如nlp的一些功能接口,这边需要引入别的东东
5.程序监控:
这里的监控是上面监控的一个汇总
1-1.基于oltp的查询
1-1-1.接口的的形式 (sql子集 or json封装 or 两者都有)
1-1-2.具体实现细节需详细考虑
(以上功能主要是用于满足oltp的crud功能,现阶段公司的业务组需要支持这些)
1-2.基于搜索的查询(自定义josn封装)
1-2-1.主搜索接口(该接口用于实现标准的搜索功能)
1-2-2.下拉提示接口
1-2-3.相关搜索接口(改接口也可并入到第一个接口中,目前分开设计,主要用于一些近义词、相关词的结果展示)
1-2-4.拼音纠错接口
1-3.基于nlp的功能接口()
1-3-1.中文分词
1-3-2.词性标注
"周杰伦出生于台湾,生日为79年1月18日,他曾经的绯闻女友是蔡依林。"
周杰伦/人名 出生/动词 于/介词 台湾/地名 ,/标点 生日/名词 为/介词 79年/时间短语 1月/时间短语 18日/时间短语 ,/标点 他/人称代词 曾经/副词 的/结构助词 绯闻/名词 女友/名词 是/动词 蔡依林/人名 。/标点
1-3-3.实体名识别
"詹姆斯·默多克和丽贝卡·布鲁克斯 鲁珀特·默多克旗下的美国小报《纽约邮报》的职员被公司律师告知,保存任何也许与电话窃听及贿赂有关的文件。"
{詹姆斯·默多克=人名, 鲁珀特·默多克旗=人名, 丽贝卡·布鲁克斯=人名, 纽约=地名, 美国=地名}
1-3-4.应用:自动问答、文本蕴涵、机器翻译
2.管理界面:
2-1.索引配置(与表结构配置相似)
2-2.违禁词、近义词等基础配置;
2-3.黑白名单配置
2-4.等等
3.分析界面:
3-1.搜索热词分析;
3-2.搜索效果评估分析;
(二和三也可统一成一个)
4.持久层:
4-1.elasticsearch(第一版应该先基于这个去做,之后的可以丰富起来)
4-1-1.集群的详细性能测试;
4-1-2.权限(数据安全)、监控的增加;
4-1-3.docker化,减少运营压力;
4-1-4.源码分析(这个的优先级并非最低,可与上述内容并行)
4-2.上面很多功能es可能无法解决,如nlp的一些功能接口,这边需要引入别的东东
5.程序监控:
这里的监控是上面监控的一个汇总