- 博客(12)
- 资源 (57)
- 收藏
- 关注
翻译 elasticsearch 短语查询(match_phrase)
1、match_phrase就像 match 查询对于标准全文检索是一种最常用的查询一样,当你想找到彼此邻近搜索词的查询方法时,就会想到 match_phrase 查询 。GET /my_index/my_type/_search{ "query": { "match_phrase": { "title": "quick brown fox
2017-10-27 15:55:28 8957
转载 ES查询-match VS match_phrase
我们以一个查询的示例开始,我们在student这个type中存储了一些学生的基本信息,我们分别使用match和match_phrase进行查询。首先,使用match进行检索,关键字是“He is”:GET /test/student/_search{ "query": { "match": { "description": "He is" } }}执
2017-10-27 15:04:59 30878 6
转载 git for windows下的Filename too long
从github克隆一个项目下发出现了错误:git有可以创建4096长度的文件名,然而在windows最多是260,因为git用了旧版本的windows api,为此踩了个坑。解决打开git命令行:git config --global core.longpaths true
2017-10-24 14:27:48 31136 9
转载 Spring框架中的单例Beans是线程安全的么
Spring框架并没有对单例bean进行任何多线程的封装处理。关于单例bean的线程安全和并发问题需要开发者自行去搞定。但实际上,大部分的Spring bean并没有可变的状态(比如Serview类和DAO类),所以在某种程度上说Spring的单例bean是线程安全的。如果你的bean有多种状态的话(比如 View Model 对象),就需要自行保证线程安全。最浅显的解决办法就是将多态be
2017-10-21 11:33:57 5226
转载 linux 之 inode详解
一、inode是什么?理解inode,要从文件储存说起。文件储存在硬盘上,硬盘的最小存储单位叫做"扇区"(Sector)。每个扇区储存512字节(相当于0.5KB)。操作系统读取硬盘的时候,不会一个个扇区地读取,这样效率太低,而是一次性连续读取多个扇区,即一次性读取一个"块"(block)。这种由多个扇区组成的"块",是文件存取的最小单位。"块"的大小,最常见的是4KB,即
2017-10-20 15:14:40 817
原创 linux No space left on device 问题排查以及解决
1、案例一:在linux上使用crontab -e 编辑crontab时(crontab -l 可以查看),系统提示:No space left on device。1)使用df -h 查看磁盘使用情况,/dev/vda2 36G 3.0G 31G 9% /tmpfs 16G 0 16G 0% /dev/shm/dev/
2017-10-20 14:55:34 12485
转载 Flume中的HDFS Sink配置参数说明
Flume中的HDFS Sink应该是非常常用的,其中的配置参数也比较多,在这里记录备忘一下。channeltype:hdfspath:写入hdfs的路径,需要包含文件系统标识,可以使用flume提供的日期及%{host}表达式。比如:hdfs://namenode/flume/webdata/filePrefix:写入hdfs的文件名前缀,可以使用flume提供的日期
2017-10-19 18:38:42 3567
转载 flume-ng原理介绍
Flume NG是Cloudera提供的一个分布式、可靠、可用的系统,它能够将不同数据源的海量日志数据进行高效收集、聚合、移动,最后存储到一个中心化数据存储系统中。由原来的Flume OG到现在的Flume NG,进行了架构重构,并且现在NG版本完全不兼容原来的OG版本。经过架构重构后,Flume NG更像是一个轻量的小工具,非常简单,容易适应各种方式日志收集,并支持failover和负载均衡
2017-10-17 11:59:30 619
原创 flume之kafka source
对于线上业务系统来说,有的时候需要对大量的数据进行统计,如果直接将数据保存到本地文件(例如使用log4j)可能会拖慢线上系统。那么,最好的方式是将大量的数据通过jms(例如:kafka)发送到消息服务器,消息中间件后面再对接flume来完成数据统计等需求。接下来,我们来介绍一下flume 的kafka source。一、理论: #-------- kafkaSour...
2017-10-17 10:33:49 14034
原创 flume高级配置——数据流的复制、分流、负载均衡、故障转移
一、在前面几篇文章中介绍过几种常见的flume pipeline 场景。我们在回顾一下,主要有一下几种:1、多个 agent 顺序连接:可以将多个Agent顺序连接起来,将最初的数据源经过收集,存储到最终的存储系统中。这是最简单的情况,一般情况下,应该控制这种顺序连接的Agent的数量,因为数据流经的路径变长了,如果不考虑failover的话,出现故障将影响整个Flow上的Agen
2017-10-13 17:10:32 3133
原创 couchbase 设置ttl失效的bug
我们都知道,业内的所有nosql数据库在存储的时候基本都可以对key设置一个ttl——(time to live),也就是失效时间。这个功能非常有用,特别是在缓存数据的更新,以及一些定时优惠等需求场景来说,更是如此。今天在couchbase上踩到了一个有意思的坑,对某个key设置了一个一年的ttl,当再次获取该key 的时候居然莫名奇妙的小时 了。public static void te
2017-10-12 14:52:02 1699 2
转载 [解决]java.io.IOException: Cannot obtain block length for LocatedBlock
在hadoop测试集群运行job的过程中发现部分运行失败,有Cannot obtain block length for LocatedBlock,使用hdfs dfs -cat ${文件}的时候也报这个错,看过代码后发现是文件未被正常关闭(flume传到hdfs上的,可能由于Namenode长时间gc或者切换或者重启会留下很多.tmp结尾的文件),为此,使用hadoop命令显示处于打开状态的文件
2017-10-10 16:16:58 502
macOS eclipse Launcher
2023-12-18
parquet-tools-1.6.0rc3.zip
2020-07-24
jQuery-Plugin-For-Easily-Readable-JSON-Data-Viewer.zip
2019-12-31
yesmeck-jquery-jsonview-v1.2.3-14-g01b1eb8.zip
2019-12-30
linux解析json工具——jq
2017-09-16
jquery 全屏显示插件
2015-03-20
apache-maven-3.2.3-bin
2014-10-21
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人