![](https://img-blog.csdnimg.cn/20201014180756918.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
大数据
文章平均质量分 90
DK_ing
这个作者很懒,什么都没留下…
展开
-
ILM(Index Lifecycle Management)
目录 概念概述 ILM触发行为 Rollover Shrink Force merge Freeze Delete 索引生命周期 阶段概念 阶段执行 索引生命周期行为 Allocate Delete Force merge Freeze Megrate Read Only Rollover Searchable snapshot Set priority Shrink Unfollow Wait for snapshot 实践 概念概述 ILM触发行为原创 2021-03-05 16:41:12 · 735 阅读 · 0 评论 -
大数据大纲
1、Java编程技术 Java编程技术是大数据学习的基础,Java是一种强类型语言,拥有极高的跨平台能力,可以编写桌面应用程序、Web应用程序、分布式系统和嵌入式系统应用程序等,是大数据工程师最喜欢的编程工具,因此,想学好大数据,掌握Java基础是必不可少的。 2、Linux命令 对于大数据开发通常是在Linux环境下进行的,相比Linux操作系统,Windows操作系统是封闭的操作系统,开...原创 2019-05-18 17:27:20 · 687 阅读 · 0 评论 -
ELK日志系统
作为系列文章的第四篇,本文将重点探讨数据采集层中的ELK日志系统。日志,指的是后台服务中产生的log信息,通常会输入到不同的文件中,比如Django服务下,一般会有nginx日志和uWSGI日志。这些日志分散地存储在不同的机器上,取决于服务的部署情况了。如果我们依次登录每台机器去查阅日志,显然非常繁琐,效率也很低,而且也没法进行统计和检索。因此,需要对日志进行集中化管理,将所有机器上的日志信息收集...转载 2019-06-13 09:03:03 · 2099 阅读 · 0 评论 -
史上最全的“大数据”学习资源
目录 关系数据库管理系统(RDBMS) 框架 分布式编程 分布式文件系统 文件数据模型 Key Map数据模型 键-值数据模型 图形数据模型 NewSQL数据库 列式数据库 时间序列数据库 类SQL处理 数据摄取 物联网和传感器 文章推荐 论文 2015 - 2016 2013 - 2014 2011 - 2012 2001 - 2010 视频 ...转载 2019-06-13 09:15:06 · 317 阅读 · 0 评论 -
基于Azkaban的任务定时调度实践
一、Azkaban介绍 Azkaban是LinkedIn开源的任务调度框架,类似于JavaEE中的JBPM和Activiti工作流框架。 Azkaban功能和特点: 1,任务的依赖处理。 2,任务监控,失败告警。 3,任务流的可视化。 4,任务权限管理。 常见的任务调度框架有Apache Oozie、LinkedIn Azkaban、Apache Airflow、Alibaba Ze...转载 2019-06-27 17:18:11 · 1222 阅读 · 0 评论