- 博客(7)
- 收藏
- 关注
转载 Elasticsearch 与 Kafka 整合剖析
1.概述 目前,随着大数据的浪潮,Kafka 被越来越多的企业所认可,如今的Kafka已发展到0.10.x,其优秀的特性也带给我们解决实际业务的方案。对于数据分流来说,既可以分流到离线存储平台(HDFS),离线计算平台(Hive仓库),也可以分流实时流水计算(Storm,Spark)等,同样也可以分流到海量数据查询(HBase),或是及时查询(ElasticSearch)。而今天笔者给大家分享的...
2018-07-11 11:22:19
386
2
转载 Nginx相关操作及配置
nginx 服务器重启命令,关闭nginx -s reload :修改配置后重新加载生效nginx -s reopen :重新打开日志文件nginx -t -c /path/to/nginx.conf 测试nginx配置文件是否正确关闭nginx:nginx -s stop :快速停止nginx quit :完整有序的停止nginx其他的停止nginx 方式:ps -ef ...
2018-07-11 11:17:03
195
转载 庖丁(Paoding)分词的词典原理解析
Paoding分词过程中词典是相关重要的一环,其特性主要有:(1)多词典支持,词典功能区分;(2)词典加载入内存使用,使用预加载和Lazy Mode模式;(3)根据分词模式,对词典进行二次编译;(4)词典变更侦测,当词典文件发生变化时,可以重新加载词典。1.1 词典类型庖丁中有多种词典,每一种词典在分词过程中都不有同的意义。主要的词典及其功能如下:(1)VocabularyDictiona...
2018-07-11 11:14:34
761
翻译 pdf2htmlEX的启动参数表
pdf2htmlEX 项目的github地址:https://github.com/coolwanglu/pdf2htmlEXpdf2htmlEX的一些参数可以设置生成文件的地址,生成文件等的说明。用法: pdf2htmlEX [options] <input.pdf> [<output.html>] -f,--first-page <int> ...
2018-07-11 11:11:23
1084
转载 PLAY框架相关博客及资料链接
不错的博客:http://www.cnblogs.com/babybluevino/p/3843537.html中文社区:http://play-framework.herokuapp.com/play框架的下载:https://playframework.com/downloadPLAY的简介:https://www.ibm.com/developerworks/cn/java/j-lo-pla...
2018-07-11 11:07:35
177
原创 Apache POI 的简介及相关github项目实现
Apache POI 是Apache下的一个开源项目,可以方便Java开发者对Word、Excel、PPT(下称微软Office)等格式的文件进行相关内容或格式的操作,与调用Open Office API来处理微软Office相关文件相比,Apache POI对微软Office(Office97)的低版本兼容性比较好。 Open Office中,对微软Office的低版本和一些具有特...
2018-07-11 11:01:24
1202
转载 eclipse4.x安装fatjar插件
1.安装Eclipse2.0版本的插件支持An error occurred while installing the items session context was:(profile=epp.package.jee, phase=org.eclipse.equinox.internal.p2.engine.phases.Install, operand=null --> [R]net...
2018-07-11 10:28:25
558
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人