- 博客(22)
- 资源 (1)
- 收藏
- 关注
转载 各消息队列对比,Kafka深度解析,众人推荐,精彩好文!
作者: Jason Guo背景介绍Kafka简介Kafka是一种分布式的,基于发布/订阅的消息系统。主要设计目标如下:以时间复杂度为O(1)的方式提供消息持久化能力,并保证即使对TB级以上数据也能保证常数时间的访问性能高吞吐率。即使在非常廉价的商用机器上也能做到单机支持每秒100K条消息的传输支持Kafka Server间的消息分区,及分布式消息消费,同时保证每个p
2015-08-08 21:31:21 61162
转载 logstash入门(简单而全面)
原文地址:http://logstash.net/docs/1.4.2/tutorials/getting-started-with-logstash英语水平有限,如果有错误请各位指正简介Logstash是一个接收,处理,转发日志的工具。支持系统日志,webserver日志,错误日志,应用日志,总之包括所有可以抛出来的日志类型。怎么样听起来挺厉害的吧?
2015-08-08 10:57:24 14443
转载 Kafka 与 Flume 对比
采集层 主要可以使用Flume, Kafka两种技术。Flume:Flume 是管道流方式,提供了很多的默认实现,让用户通过参数部署,及扩展API.Kafka:Kafka是一个可持久化的分布式的消息队列。Kafka 是一个非常通用的系统。你可以有许多生产者和很多的消费者共享多个主题Topics。相比之下,Flume是一个专用工具被设计为旨在往HDFS,HBase发送
2015-08-08 10:27:31 1789
原创 开源远程登录、远程查看工具你知道几个
详细工具说明链接地址:https://code.csdn.net/openkb/c-2102putty项目介绍:PuTTY为一开放源代码软件,主要由Simon Tatham维护,使用MIT licence授权。是一个Telnet、SSH、rlogin、纯TCP以及串行接口连接软件。较早的版本仅支持Windows平台,目前开始支持各类Unix平台,并打算移植至Mac OS X
2015-08-07 23:10:23 2130
转载 开源日志系统比较:scribe、chukwa、kafka、flume
1. 背景介绍许多公司的平台每天会产生大量的日志(一般为流式数据,如,搜索引擎的pv,查询等),处理这些日志需要特定的日志系统,一般而言,这些系统需要具有以下特征:(1) 构建应用系统和分析系统的桥梁,并将它们之间的关联解耦;(2) 支持近实时的在线分析系统和类似于Hadoop之类的离线分析系统;(3) 具有高可扩展性。即:当数据量增加时,可以通过增加节点进行水平扩
2015-08-07 23:00:55 469
转载 solr中ik分词自定义词库和停止词
1、在solr的web中:\WEB-INF目录下新增一个文件夹:classes 2、新增一个文件:IKAnalyzer.cfg.xml IK Analyzer 扩展配置 my.dic; stopword.dic; 3、新增my.dic文件。文件格式必需是:无BOM的UTF-8格式,示例内容为:么么哒
2015-07-23 17:13:00 5767 4
原创 solr suggest配置
1.修改solrconfig.xml,添加如下内容 string <!--Optional, it is required when more than one spellchecker is configured. Select non-default name with spellcheck.d
2015-07-23 16:53:40 641
原创 solr分词只能全词匹配怪现象
现象:例如ik分词,安装配置后,可以正常分词,如下图所示Index和Query都没问题了,十分高兴吧!随后,创建collection,导入数据,再尝试搜索。如下图所示,我们搜索“第四次会议”,可以看到有3条记录,还有点小兴奋!既然已经分词了,应该可以搜索非完全匹配的,如下图所示:fuck!Why 搜索“第五次会议”一条匹配的没有?关键搜索条件也进行了分词!郁闷的
2015-07-22 17:05:44 10117 2
原创 solr安装ansj_seg分词
1.下载nlp_lang,下载地址:http://maven.ansj.org/org/nlpcn/nlp-lang/0.3/,得到jar包nlp-lang-0.3.jar2.下载ansj-seg,http://maven.ansj.org/org/ansj/ansj_seg/也可以下载源码自己编译,源码下载地址:https://github.com/NLPchina/ansj_s
2015-07-16 11:15:12 3736 1
原创 solr安装mmseg4j 分词器
1.下载资料 https://github.com/chenlb/mmseg4j-solr 注意版本:mmseg4j-solr-2.0.0.jar 要求 lucene/solr >= 4.3.0。在 lucene/solr [4.3.0, 4.7.1] 测试过兼容可用。mmseg4j-solr-2.1.0.jar 要求 lucene/solr 4.8.xmmseg4
2015-07-15 15:16:56 1511
原创 solr中Zookeeper指令
1.upconfigjava -classpath %TOMCAT_HOME%\webapps\solr\WEB-INF\lib/* org.apache.solr.cloud.ZkCLI -cmd upconfig -zkhost 127.0.0.1:2181,127.0.0.1:2182,127.0.0.1:2183 -confdir F:\solr_home1\collection1
2015-07-14 20:47:13 1330
转载 Schema.xml详解
引自:http://iamyida.iteye.com/blog/2213354schema.xml是用来定义索引数据中的域的,包括域名称,域类型,域是否索引,是否分词,是否存储,是否标准化即Norms,是否存储项向量等等。 schema.xml配置文件的根元素就是schema,有个name属性,name属性值可以随便配,根元素没什么好说的,schema元素下主
2015-07-14 20:44:00 2725
原创 solr安装配置拼音分词器
1.准备jar包将ik的jar包、pinyin4j-2.5.0.jar、solr-4.9.0\contrib\analysis-extras\lucene-libs\lucene-analyzers-smartcn-4.9.0.jar拷贝到%TOMCAT_HOME%\webapps\solr\WEB-INF\lib下2.修改schema.xml
2015-07-14 20:40:11 3321 1
转载 创建用户、授权、数据导入导出
创建用户与授权这里,我将Oracle当做一个类似于OA的管理系统来学习。首先,安装oracle是第一步,学习状态下安装oracle的人比比皆是,事实上,能够在生产环境下安装oracle的人却凤毛麟角,有的人和oracle打一辈子交道,不一定实际的做过一次oracle数据库实施,但也从另一个角度上看出,oracle的安装实际上并不简单,能够在不同的环境下安装好oracle确实是一
2013-03-17 12:31:46 1384
原创 彻底卸载orcale
1.关闭oracle所有的服务。可以在windows的服务管理器中关闭; 2.打开注册表:regedit 打开路径: HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\ 删除该路径下的所有以oracle开始的服务名称,这个键是标识Oracle在windows下注册的各种服务! 3.打开注册表,找到路径: HKEY_
2013-03-15 23:26:20 731
原创 oracle创建多个数据库,通过浏览器链接问题
今天被一个小问题搞的很郁闷,新创建的数据库不知道如何在浏览器中打开~ 首先,在利用Database Configuration Assistant创建数据库时,在步骤4中要勾选“使用Enterprise Manger”,如下图所示: 此处需要注意的是,有时候上面的界面出不来,那么就直接点击“下一步”,然后再点击“上一步”回到该页面即可。 最后安装完成后就
2012-11-19 16:38:46 355
原创 javafx环境搭建
安装sdk 在jdk7中已经集成了javaFx SDK,所以最简单方式就是安装jdk7,下载连接如下: http://www.oracle.com/technetwork/java/javase/downloads/index.html下载JavaFx Scene Builder 此工具由官方出品,主要是设计界面,输出为扩展
2012-11-13 15:43:03 813
转载 win8下安装oracle
项目需要,今天在win8上安装oracle10g,但总是第一步就提示:"程序异常终止,发生未知错误",通过搜索发下如下方法:1.修改E:\oracle安装文件\10201_database_win32\database\stage\prereq\db路径下refhost.xml当打开refhost.xml 后会发现有 .....只要在 后面添加
2012-11-13 15:15:11 555
转载 Java基础(反射案例)
package cn.itcast.test; import java.util.ArrayList; import java.util.List; import org.junit.Test; /** * 这个案例表明的意思是怎么向指定类型的集合添加不同类型的数据 */ public class ReflectedTest { /** * 用两种解决方
2012-11-11 21:34:12 317
转载 java通过pid来kill进程
近段工作用到了线程方面的东西,拿出一些来和大家进行分享下,这里主要是通过pid来kill进程,以下是方法public void killByPid(String str) { final String[] Array = { "ntsd.exe", "-c", "q", "-p", str }; int i = 0; try { Process p
2012-11-09 22:48:19 1068
原创 养成记录的好习惯
博客第一篇,希望以此为鉴,督促自己养成记录的好习惯。 IT的知识点太多了,好多时候第二次用到一个知识点时,只记得当初用过,但如何去用却忘的一干二净。更有在实现某个功能是需要注意得点,只有再次遇到这个问题时才后悔当初没有记录一下。 给自己定个要求吧,每周至少写一篇博客,内容不限,主要是摘录一些知识点,方便日后查看,也希望能为网友提供便利。
2012-11-09 22:46:24 603
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人