![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
大数据
calorie卡卡
这个作者很懒,什么都没留下…
展开
-
Hive详解
Hive使用必知必会系列一、Hive的几种数据模型内部表 (Table 将数据保存到Hive 自己的数据仓库目录中:/usr/hive/warehouse)外部表 (External Table 相对于内部表,数据不在自己的数据仓库中,只保存数据的元信息)分区表 (Partition Table将数据按照设定的条件分开存储,提高查询效率,分区-----> 目录)桶表 (Buck...转载 2019-07-03 09:17:02 · 485 阅读 · 0 评论 -
数据可视化工具
数据可视化无处不在,而且比以前任何时候都重要。无论是在行政演示中为数据点创建一个可视化进程,还是用可视化概念来细分客户,数据可视化都显得尤为重要。以前的工具的基本不能处理大数据。无论你是需要对数据进行分析并且决定用最好的方式向你的客户或同事进行展示,还是你心里有一个视觉化布局但需要将此概念应用到生活中,该表单中总会有一款工具能够满足你的需求。1.Polymaps需要在地图上展示复杂的数据集?P...转载 2019-07-03 09:43:59 · 1028 阅读 · 0 评论 -
理解什么是大数据和Hadoop
HDFS是Hadoop系统的存储部分。它是块结构的文件系统,其中每个文件被分成预定大小的块。这些块存储在一台或多台机器的集群中。HDFS适用于两种类型的节点:NameNode(主节点)和DataNodes(从节点)Hadoop NameNodesNameNodes是HDFS文件系统的核心。它们保留文件系统中所有文件的目录树,并跟踪集群中数据的保存位置。它们不存储这些文件的数据。这是一台非常高效...翻译 2019-07-05 09:25:14 · 426 阅读 · 2 评论 -
数据仓库:过去,现在和未来
在当今世界,数据正在快速生成,尤其是几乎每个行业的企业都经历数字化转型。我们也看到了前所未有的需求,使每个业务决策者都能够访问实时数据,以便他们能够为业务做出最明智的决策。全球公司比以往任何时候都更多地将虚拟团队分散到世界各地,使他们能够使用所有可用数据做出明智的业务决策。例如,零售商不仅要考虑过去的购买和浏览历史,还要使用所有公开的客户信息,例如他们的专业和雇主,他们的观看和收听兴趣,体育和爱好...翻译 2019-07-05 09:31:53 · 742 阅读 · 3 评论 -
HDFS内部原理解析
HDFS定义:它是一个分布式文件系统,用于存储大文件,分布式系统整合个多台机器的计算能力和存储能力,适合于一次写入数据,多次读出的场景,适合用于数据分析组成架构:NameNode:1,管理HDFS的命名空间2,配置副本策略3,管理数据块的映射信息4,处理客户端的读写请求DataNode:1,存储实际的数据块2,执行文件的的读写操作3,负责块的创建,删除Second...原创 2019-08-17 17:12:11 · 400 阅读 · 0 评论 -
数据可视化工具
大数据可视化展示工具(开源免费)1.BIRTBIRT是一种开源BI软件,可用于创建数据可视化和报告,这些都可以嵌入到Web应用程序中。主要组件是可视化报表设计器,用于生成设计的运行时组件以及图表引擎。该平台拥有超过1200万的下载量以及BIRT开发人员中心的社区中心。2. ClicdataClicData提供ClicData Personal,它是仪表板软件的免费版本,可为单个用户提供...原创 2019-09-10 10:52:05 · 847 阅读 · 0 评论