自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

  • 博客(6)
  • 资源 (3)
  • 收藏
  • 关注

原创 saiku多sort改造

saiku原生支持在行和列上添加排序规则,如果需要对维度分别设置上排序则需要进行代码改造 首先要了解saiku生成mdx的规则:主要依靠saiku-query这个工具(https://github.com/OSBI/saiku-query)。 saiku中ThinQuery与页面对应记录行列信息包含维度、层级等,查询时,请求发送至服务端,由Fat的convert方法将ThinQuery对应转化成sa

2017-03-09 19:55:11 781

原创 mondrian join支持

mondrian join支持 https://github.com/xiaofanyw/mondrian-join-support

2016-12-08 20:12:40 837

原创 saiku无缝对接kylin

saiku通过添加schema和datasource的形式管理对接入系统的数据源,然后提供界面作为直观的分析数据方式,界面产生mdx,由mondrian连接数据源,解析mdx和执行查询 kylin提供大规模数据的olap能力,通过saiku与kylin的对接,利用saiku的友好界面来很方面的查询         关于saiku与kylin的对接,https://github.com/must

2016-09-05 18:47:16 7736 19

原创 实现flume tailfsource解决丢数等问题

使用flume过程中,实时的收集数据时,一般使用exec的source,通过tail -F的形式收集日志内容,但是tail -F存在包括丢数在内一系列问题,实现tailfsource解决: public class TailingFileSource extends AbstractSource implements EventDrivenSource, Configurable {

2015-07-16 14:25:50 3470

转载 CRF++的简单使用

CRF++的简单使用 分类: 语言学研究 2009-06-22 12:09 2807人阅读

2011-07-22 09:43:06 480

转载 基于CRF的中文分词

CRF简介Conditional Random Field:条件随机场,一种机器学习技术(模型)CRF由John Lafferty最早用于NLP技术领域,其在NLP技术领域中主要用于文本标注,并有多种应用场景,例如:分词(标注字的词位信息,由字构词)词性标注(标注分词的词性,例如

2011-07-20 10:28:09 309

linux 常用指令

一、文件目录类 1.建立目录:mkdir 目录名 2.删除空目录:rmdir 目录名 3.无条件删除子目录: rm -rf 目录名 4.改变当前目录:cd 目录名 (进入用户home目录:cd ~;进入上一级

2011-07-26

最大熵理论及其应用解析

队最大熵模型进行深入分析 „ 最大熵理论 „ 基于最大熵的统计建模 „ 最大熵工具包的使用 „ 最大熵模型与其他模型的比较

2011-07-26

实体识别系统调研报告

着重于对隐马尔科夫(HMM),最大熵(ME)和条件随机场(CRF)三个基于统计的实体识别模型的详细介绍, 基于规则的实体识别模型的框架与识别步骤的介绍,以及基于规则和统计的混合实体识别模型的运用

2011-07-26

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除