大数据
文章平均质量分 94
BAStriver
无限自由中偏爱的一种约束,就是梦想。
展开
-
关于通过Asvc生成测试数据(Avro/Parquet)的工具类 小结
目录1. Avsc和Avro的关系2. Avsc生成Java类3. 根据Java类生成Avro格式的测试数据3.1 Avsc的schema types3.2 Complex type的使用3.3 生成测试数据1. Avsc和Avro的关系AVSCfile is anApache AvroSchema. Avro is a remote procedure call and data serialization framework developed within...原创 2021-02-03 16:40:29 · 1472 阅读 · 0 评论 -
ES6.6.2 使用小结 - 文档操作
1.文档基本操作分为:文档获取、删除、更新。以下是一些简单的测试。2.假设当前ES存在如下数据(两条)。3.文档操作源码如下:package com.bas.demo;import com.bas.util.ESUtil;import org.elasticsearch.action.get.GetResponse;import org.elasticsearch.cli...原创 2019-03-24 17:16:47 · 569 阅读 · 0 评论 -
ES6.6.2 使用小结 - ES工具类使用
1.以下是封装了ES常用的基本方法,可以用来做一些简单的测试。 如:获取ES的TransportClient/IndicesAdminClient、判定索引是否存在、创建索引、设置mapping、删除索引、插入文档。package com.bas.util;import org.elasticsearch.action.admin.indices.create.CreateInde...原创 2019-03-24 15:06:37 · 1974 阅读 · 0 评论 -
ES6.6.2 使用小结 - Java连接ES并查询数据
1.如果需要查看如何创建Maven项目,可以看这里:ES6.6.2 使用小结 - 创建Maven项目2.先在ES(安装了head插件)创建一个Index吧,如果是单机部署ES,副本数记得写0,不然健康值会是黄色,假设这里索引名是"app_account"。3.承接上一篇文章,这里首先是在com.bas下创建demo包,以下是完整代码:package com.bas.demo;...原创 2019-03-24 14:22:10 · 3148 阅读 · 0 评论 -
ES6.6.2 使用小结 - 创建Maven项目
1.前提:假设ES、JDK、Idea以及Maven都安装成功。2.创建Maven快速启动项目。选择项目类型:3.输入基础包名、项目名称:4.选择Maven安装路径:5.选择项目路径:6.选择构建项目:7.构建完成大概需要几分钟啦,然后呢,修改pom.xml添加ES依赖包:<dependencies> <!-- https...原创 2019-03-24 14:08:02 · 1029 阅读 · 0 评论 -
ES6.6.2 使用小结 - 封装ES常用的查询方法
1.首先,接下来的查询demo里面包含了10常用的方法:term查询、terms查询、range查询、exists查询、prefix查询、wildcard查询、regexp查询、fuzzy查询、type查询、ids查询。2.以下是封装了10个常用方法的QueryUtil:package com.bas.util;import org.elasticsearch.action.sear...原创 2019-03-26 18:26:03 · 1238 阅读 · 0 评论 -
ES6.6.2 使用小结
1.使用6.6.2版本的ES前,首先来安装ES吧,Win10下安装教程参考:https://blog.csdn.net/chy2z/article/details/804615032.接着,就是通过Java来连接ES了。首先要知道分为两种Java Rest客户端:低级客户端、高级客户端。低级客户端:该客户端通过http来连接Elasticsearch集群。用户在使用该客户端时需要将请求...原创 2019-03-24 18:23:48 · 571 阅读 · 0 评论 -
ES6.6.2 使用小结 - 全量查询数据
1.通过这篇文章来讲讲如何进行全量查询。2.假设当前ES存在如下数据(两条)。3.全量查询源码如下:package com.bas.demo;import com.bas.util.ESUtil;import org.elasticsearch.action.search.SearchResponse;import org.elasticsearch.client.tr...原创 2019-03-24 18:17:20 · 1401 阅读 · 0 评论 -
ES6.6.2 使用小结 - 批量操作
1.文档的操作基本分为:查询、删除、更新、插入。 这些操作都可以进行批量进行,包括:批量处理器执行、批量执行、查询时执行删除。2.假设当前ES存在如下数据(两条)。3.批量操作源码如下:package com.bas.demo;import com.bas.util.ESUtil;import org.elasticsearch.action.bulk.*;impo...原创 2019-03-24 18:10:08 · 1625 阅读 · 0 评论 -
总结大数据采集的一些见解
1.首先,在我看来,基本上根据数据的流向自底向上划分五层,跟传统的数据仓库其实很类似,数据类的系统,概念上还是相通的,分别为五个:数据采集层、数据处理层、数据分析层、数据访问层及应用层。2.数据采集层:由于数据源的多样性,很多时候我们采集的工具可能不止一个。大数据平台架构跟传统数据仓库有一个不同,就是同一层次,为了满足不同的场景,会采用更多的技术组件,体现百花齐放的特点。既包括传统的ETL离线...转载 2019-03-08 18:16:19 · 1944 阅读 · 0 评论