准备了好久的问题未被提及,被质询的问题很无奈,我们的科研环境就是这样。
简单记录下可公开的部分
Q:亲密度分析
A:采用海量数据访问框架,以分析内容为目标,通过均值分布方法,在海量数据信息中计算特定业务属性的欧式距离,以求得关于目标的最亲密信息。
Q:轨迹分析
A:预先计算特定位置集合的空间拓扑,根据输入的轨迹,结合路网信息计算出最接近的位置序列,再通过概率预测算法,在目标数据集合中计算其最拟合的位置序列,给出TOP建议
Q:异常流量分析
A:采用多模式匹配AC-BM算法,过滤出目标数据集合,通过小波预测方式敏感识别流量异常,通过ARMA结合业务采样信息确认异常。
Q:文本溯源
A:采用专业领域分词技术,根据特定条件在海量文本中检索相关信息,通过结果信息的关联关系,建立点关联关系并进行图的深度遍历,最终得到的根,即为源头