大数据Hadoop
文章平均质量分 81
爱编码的撸铁男
这个作者很懒,什么都没留下…
展开
-
史上最详细从零开始安装虚拟机和linux的CtenOs系统
史上最详细从零开始安装虚拟机和linux系统安装包一、pandas是什么?二、使用步骤1.引入库2.读入数据总结安装包一、pandas是什么?示例:pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。二、使用步骤1.引入库代码如下(示例):import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as snsimport warningswarni原创 2021-03-31 14:39:06 · 465 阅读 · 5 评论 -
大数据可视化工具-metabase零基础详细操作文档
大数据可视化工具-metabase零基础详细操作文档一、登录二、添加数据源1,点击设置,点击管理员2,选择数据库标签,点击添加数据库3,添加数据库三、将数据源的展示字段改为中文1,选择一个数据源2,点击下图中按钮3,在下面红框中进行编辑即可4,查看创建的问题中的字段展示四、仪表盘创建流程步骤1,创建集合(1)进入集合列表(2)点击进入到《我的个人合集》(3)点击新建集合进行集合的创建步骤2,创建问题方式一:简单查询1,选择简单查询,选择数据源:2,选选择数据表:3,可视化4,添加过滤器:5,添加聚合6,保存原创 2021-03-30 11:19:45 · 1994 阅读 · 1 评论 -
史上最详细从零搭建分布式Hadoop集群环境
史上最详细从零搭建分布式Hadoop集群环境和使用Hadoop集群搭建和使用一,简单介绍二,准备虚拟机环境三,安装包四,安装五,shell操作Hadoop集群搭建和使用一,简单介绍HADOOP集群具体来说包含三个模块:HDFS集群,YARN集群(两者逻辑上分离,但物理上常在一起)和MapreduceHDFS集群:负责海量数据的存储,集群中的角色主要有 NameNode / DataNodeYARN集群:负责海量数据运算时的资源调度,集群中的角色主要有 ResourceManager /Node原创 2021-03-25 18:13:56 · 161 阅读 · 0 评论