功能特色
Ø 多源大数据整合;
Ø 信息的语义关联:依据关键词自动关联不同来源数据;
Ø 后台服务与前端个性化应用分离:后台全数据处理,前端应用自动筛选成自己的智库知识平台,后续围绕自己的数据进行细化分析。
信息源特点
Ø 网页深度:浅层网页+社交网络垂直数据;
Ø 文档格式:txt, html + word, pdf, ppt, excel文档
Ø 内外网:Internet + Intranet;
Ø 语言:可以直接做中英文的分析,同时兼容维语等少数民族语言;
软件总体架构
开发环境选型
环境 | 选型简述 |
后台内核服务 | C/C++,前期Windows,后期移植到Linux |
前台应用 | Java |
可视化展示 | Html5+javascript |
数据库 | HBase,前期MySQL |
搜索引擎 | JZSearch精准搜索引擎 |