- 博客(6)
- 资源 (56)
- 收藏
- 关注
原创 ElasticSearch 常用的查询过滤语句
term 过滤term主要用于精确匹配哪些值,比如数字,日期,布尔值或 not_analyzed 的字符串(未经分析的文本数据类型):#完整的例子, hostname 字段完全匹配成 saaap.wangpos.com 的数据:{ "query": { "term": { "hostname": "saaap.wangpos.com" } ...
2018-12-11 10:21:12 1403 1
原创 《从Paxos到ZooKeeper分布式一致性原理与实践》阅读笔记
第一章 分布式架构1.1 从集中式到分布式集中式的特点: 部署结构简单(因为基于底层性能卓越的大型主机,不需考虑对服务多个节点的部署,也就不用考虑多个节点之间分布式协调问题) 分布式系统是一个硬件或软件组件分布在不同的网络计算机上,彼此之间仅仅通过消息传递进行通信和协调的系统。分布式的特点:分布性:在空间随意分布 对等性:没有主从之分,都是对等的 并发性 缺乏全...
2018-12-07 13:14:11 327
原创 使用hive来分析nginx的log日志
在hive 的安装目录启动hive后。[root@master hive]# ./bin/hivewhich: no hbase in (/usr/tools/hadoop-2.7.3/bin/:/usr/java/jdk1.7.0_79/bin/:/usr/local/sbin:/usr/local/bin:/sbin:/bin:/usr/sbin:/usr/bin:/root/bin)...
2018-12-04 21:10:02 664
原创 hive原理背景介绍
Hive是一个数据仓库基础工具在Hadoop中用来处理结构化数据。它架构在Hadoop之上,总归为大数据,并使得查询和分析方便。并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。术语“大数据”是大型数据集,其中包括体积庞大,高速,以及各种由与日俱增的数据的集合。使用传统的数据管理系统,它是难以加工大型数据。因此,Apache软件基金会推出了一款名为Hado...
2018-12-03 15:40:55 430
原创 hbase背景原理介绍
自1970年以来,关系数据库用于数据存储和维护有关问题的解决方案。大数据的出现后,好多公司实现处理大数据并从中受益,并开始选择像 Hadoop 的解决方案。Hadoop使用分布式文件系统,用于存储大数据,并使用MapReduce来处理。Hadoop擅长于存储各种格式的庞大的数据,任意的格式甚至非结构化的处理。Hadoop的限制Hadoop只能执行批量处理,并且只以顺序方式访问数据。这意...
2018-12-03 15:20:25 885
原创 hadoop背景原理介绍
Hadoop是一个开源框架,它允许在整个集群使用简单编程模型计算机的分布式环境存储并处理大数据。它的目的是从单一的服务器到上千台机器的扩展,每一个台机都可以提供本地计算和存储。“90%的世界数据在过去的几年中产生”。由于新技术,设备和类似的社交网站通信装置的出现,人类产生的数据量每年都在迅速增长。美国从一开始的时候到2003年产生的数据量为5十亿千兆字节。如果以堆放的数据磁盘的形式,它可以...
2018-12-03 15:16:05 580
redis-desktop-manager-0.8.3-2550.dmg
2018-12-25
head+first+servlets jsp
2018-07-31
深入理解Java虚拟机[JVM高级特性与最佳实践](周志明)
2018-07-31
从PAXOS到ZOOKEEPER分布式一致性原理与实践
2018-07-31
mac的网络传输分析工具
2018-07-06
mac数据恢复
2018-07-06
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人