自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

欲望以提升热忱毅力以磨平高山

古人学问无遗力，少壮工夫老始成。纸上得来终觉浅，绝知此事要躬行。

12月 11月 09月 08月 04月 03月

原创 Hive抽数到ElasticSearch实现

一、背景有关ES的详细介绍参考：https://www.cnblogs.com/cjsblog/p/9439331.html 公司有些比如使用算法训练的模型数据等需要快速的检索性能，最终选择使用ES来存储，然后使用别名来区分每一批次的最新数据，对外（web接口）只需暴露别名即可。二、常规实现ES数据全量数据摄入（Overwrite模式）覆盖方式或许是公司最常用的方式，每天T+1或者...

2019-09-29 11:28:01 819 2

原创有关数仓增量和全量同步的一些思考

背景相信很多公司都是基于Hive做的数仓，从而对外提供数据服务。这里只讨论离线数仓，做数仓必然离不开对大量数据的ETL处理工作。目前的ETL种类繁多，可选择的工具也有很多，比如使用Sqoop, DataX做离线的T+1数据同步, Spark或者Flink做T+0的实时数据同步等。目前有很多公司业务是T+1的，每天需要同步昨天的业务库（MySQL、mongodb等）的数据到Hive数据仓库中，...

2019-09-26 16:07:29 2495

原创 Hive静态分区数据拷贝

Hive版本：2.1.1set hive.support.quoted.identifiers=none;insert overwrite table ods.ods_call_logs_xx partition(pt='2019-09-22') select `(pt)?+.+` from test_ods.ods_call_logs_xx where pt = '2019-09-22...

2019-09-24 10:12:51 421

原创 mongodb取数至数仓总结

问题描述：目的：使用mongoexport工具将mongo表数据抽到hive仓库中（T+1）并进行初步清洗遇到的问题：1、抽数的科学记数法问题2、json格式嵌套导致列错乱的问题通常做法：1、使用如下命令将数据导出csv格式source /etc/profile;mongoexport --host xxxxx \--port 27012 --username xxx...

2019-09-07 11:04:21 1103

转载使用子查询可提升 COUNT DISTINCT 速度 50 倍

Countdistinct是SQL分析时的祸根首先：如果你有一个大的且能够容忍不精确的数据集，那像HyperLogLog这样的概率计数器应该是你最好的选择。但对于需要快速、精准答案的查询，一些简单的子查询可以节省你很多时间。让我们以我们一直使用的一个简单查询开始：哪个图表的用户访问量最大？select dashboards.name, count(distinct ...

2019-09-02 22:09:13 192

数据湖技术Iceberg的探索与实践.pdf

文章分享

2021-01-19

solr7.0性能测试报告

该资源为本人亲自整理的报告，多线程代码未给出，不是太难我相信你能搞定。

2017-12-10

cdh-5.8.5安装手册

cdh5.8.5安装，安装文档来，搭建cdh不成问题，如果有什么疑问，欢迎qq:844870676,共同学习

2017-12-10

H2DB所需的jar和DEMO示例，可直接导进eclipse中

H2DB java 内存数据库，这里有所需的jar和DEMO示例，可直接导进eclipse中，很好的入门资料，欢迎下载！

2015-05-21

Android 线程AsyncTask逐步在list中加入条目

一个ListView的小例子，一开始List中没有内容，通过一个AsyncTask逐步在List中加入条目，适合新手学习AsyncTask多线程，本人整理能运行，有详细的注解。

2013-10-12

Android上获得系统root权限的方法

Android上获得系统root权限的方法，仅供参考哈~~

2013-10-09

2013年12月大学英语六级考试2000高频词汇+30篇预测作文

高频词汇2000个用于今年的六级考试，另外额外奉送30篇预测作文，惊喜等你来拿~

2013-10-09

百度地图API 之定位周边搜索POI

该资源提过给你了百度地图API 之定位周边搜索POI的详细代码，可供参考

2013-10-07

android在wifi下手机与电脑的socket通信

该实例给出了android在wifi下手机与电脑的socket通信的具体详解

2013-10-07

android界面效果全汇总

开发android必备的UI界面基础知识，该资料里面涉及了大部分常用的屏幕变化的效果，有源码可以供参考。

2013-10-07

88个经典logo

88个经典的logo，做网站和android应用常用的

2013-10-07

flash教程（好用的）

该flash教程适合新手入门，里面有丰富的实例供大家参考，学习了哈

2013-10-07

web应用技术入门范例非常实用

该资源里面包括：板式切换旅游网站企业网站网上购物网站博客小型工作室网站等另外如果还有不懂DIV+CSS的该资料绝对让你惊艳当然本人整理需要一点资源分请见谅哈

2013-10-07

HttpClient 下载图片源码分享

HttpClient下载图片源码很好用的，大家可以下载一下，很适合新手学习用

2013-10-07

xalan.jar 部署webservice要用的

xalan.jar包用于部署webservice在myeclipse上

2013-08-19

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

谭正强 CSDN认证博客专家 CSDN认证企业博客

码龄11年

IP 属地：上海市

IP属地以运营商信息为准，境内显示到省（区、市），境外显示到国家（地区）

268: 原创

3万+: 周排名

1万+: 总排名

68万+: 访问

: 等级

8336: 积分

358: 粉丝

507: 获赞

106: 评论

891: 收藏

私信

关注

热门文章

分类专栏

最新评论

Spring-kafka消费者消费的一些问题
普通网友: 文章内容通俗易懂，适合不同层次的读者。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
k8s快速上手实操
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天值得看】榜单，全部的排名请看 https://bbs.csdn.net/topics/619008331。
macbook本地部署 pyhive环境连接 hive用例
谭正强: 虚拟环境的问题已经解决，上面是我配置错误导致的，在 pycharm中你可以指定你自己的虚拟环境
macbook本地部署 pyhive环境连接 hive用例
谭正强: 共同学习😄
macbook本地部署 pyhive环境连接 hive用例
普通网友: 你的博客内容深入浅出，总是让我不再感到学习的困难，每一篇博文都是我学习的宝库。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】

最新文章

提示

确定要删除当前文章？

取消删除