- 博客(6)
- 资源 (3)
- 收藏
- 关注
原创 saiku多sort改造
saiku原生支持在行和列上添加排序规则,如果需要对维度分别设置上排序则需要进行代码改造 首先要了解saiku生成mdx的规则:主要依靠saiku-query这个工具(https://github.com/OSBI/saiku-query)。 saiku中ThinQuery与页面对应记录行列信息包含维度、层级等,查询时,请求发送至服务端,由Fat的convert方法将ThinQuery对应转化成sa
2017-03-09 19:55:11 781
原创 mondrian join支持
mondrian join支持 https://github.com/xiaofanyw/mondrian-join-support
2016-12-08 20:12:40 837
原创 saiku无缝对接kylin
saiku通过添加schema和datasource的形式管理对接入系统的数据源,然后提供界面作为直观的分析数据方式,界面产生mdx,由mondrian连接数据源,解析mdx和执行查询 kylin提供大规模数据的olap能力,通过saiku与kylin的对接,利用saiku的友好界面来很方面的查询 关于saiku与kylin的对接,https://github.com/must
2016-09-05 18:47:16 7736 19
原创 实现flume tailfsource解决丢数等问题
使用flume过程中,实时的收集数据时,一般使用exec的source,通过tail -F的形式收集日志内容,但是tail -F存在包括丢数在内一系列问题,实现tailfsource解决: public class TailingFileSource extends AbstractSource implements EventDrivenSource, Configurable {
2015-07-16 14:25:50 3470
转载 基于CRF的中文分词
CRF简介Conditional Random Field:条件随机场,一种机器学习技术(模型)CRF由John Lafferty最早用于NLP技术领域,其在NLP技术领域中主要用于文本标注,并有多种应用场景,例如:分词(标注字的词位信息,由字构词)词性标注(标注分词的词性,例如
2011-07-20 10:28:09 309
linux 常用指令
2011-07-26
实体识别系统调研报告
2011-07-26
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人