BigData
文章平均质量分 84
专注于大数据的学习记录
北慕辰
优秀的发挥,失败的积累,每天都很完美。
展开
-
【千里之行,始于足下】大数据高频面试题——Hadoop篇(一)
大数据高频面试题——Hadoop篇(一)原创 2021-10-28 21:23:29 · 1244 阅读 · 2 评论 -
数据集成工具的使用(五)---Kettle 从理论学习到熟练使用
数据采集工具Kettle 的详细介绍原创 2021-10-22 14:19:13 · 8908 阅读 · 8 评论 -
数据集成工具的使用(四)---Flume 从理论学习到熟练使用
数据采集工具Flume 的详细介绍与使用...原创 2021-10-19 21:13:16 · 5278 阅读 · 2 评论 -
数据集成工具的使用(三)---FlinkX 从理论学习到熟练使用
数据采集工具FlinkX 的详细介绍与使用原创 2021-10-19 19:45:50 · 8336 阅读 · 3 评论 -
数据集成工具的使用(二)---DataX 从理论学习到熟练使用
数据采集工具DataX 的详细介绍...原创 2021-10-19 16:34:54 · 5565 阅读 · 2 评论 -
”2021年安徽省大数据与人工智能应用竞赛“ 大数据(网络赛)-本科组赛题 第二部分:大数据预处理部分 赛题回顾
”2021年安徽省大数据与人工智能应用竞赛“ 大数据(网络赛)-本科组赛题 第二部分:大数据预处理部分 赛题回顾原创 2021-10-13 12:22:47 · 2747 阅读 · 4 评论 -
数据集成工具的使用(一)---Sqoop 从理论学习到熟练使用
数据采集工具Sqoop 的详细介绍\Sqoop简介\Sqoop原理架构Sqoop的安装sqoop import 从传统的关系型数据库导入HDFS、HIVE、HBASE…sqoop export操作 从HDFS、HIVE、HBASE… 导出到传统的关系型数据库原创 2021-10-08 21:13:46 · 1510 阅读 · 2 评论 -
Hbase从入门到精通,精心整理的学习笔记,自学党快来瞅一瞅,赶紧收藏吧!
Hbase学习笔记,详细整理原创 2021-09-20 19:28:43 · 4296 阅读 · 18 评论 -
【千里之行,始于足下】大数据高频面试题——Hive篇(一)
hive高频面试题,汇总整理23题1、Hive的排序函数有哪些(4种)2、MySQL索引,索引失效,联合索引。3、说下你对mapreduce的了解4、说下你对窗口函数的了解5、row_number,rank,dense_rank有什么区别...原创 2021-09-14 22:17:18 · 1926 阅读 · 17 评论 -
Hive从入门到精通,HQL硬核整理四万字,全面总结,附详细解析,赶紧收藏吧!!
一、了解Hive二、Hive的基本语法三、Hive的数据类型四、Hive HQL使用语法五、Hive HQL使用注意六、Hive 的函数使用七、Hive 的Shell使用原创 2021-09-08 15:30:32 · 12493 阅读 · 24 评论 -
Hadoop集群HDFS、YARN高可用HA详细配置步骤说明,附Zookeeper搭建详细步骤【建议收藏!!!】
Hadoop集群HDFS、YARN高可用HA详细配置步骤说明,附Zookeeper搭建详细步骤原创 2021-09-06 13:23:40 · 2551 阅读 · 5 评论 -
Hadoop深入浅出 ——三大组件HDFS、MapReduce、Yarn框架结构的深入解析式地详细学习【建议收藏!!!】
我们知道目前Hadoop主要包括有三大组件,分别是:分布存储框架(HDFS)、分布式计算框架(MapReduce)、以及负责计算资源调度管理的平台(Yarn),那么今天我们就来解析式的深入学习了解这三大组件。一、HDFS框架 HDFS(Hadooop Distributed File System)是Hadoop项目原创 2021-09-05 14:26:18 · 3709 阅读 · 20 评论 -
Redis主从复制 以及 集群搭建 详细步骤解析,赶快收藏练手吧!
...一、Redis主从复制(Replication)、二、Redis集群搭建原创 2021-08-29 20:44:28 · 827 阅读 · 2 评论 -
Redis从青铜到王者,从环境搭建到熟练使用,看这一篇就够了,超全整理详细解析,赶紧收藏吧
一、常见的非关系型数据库NOSQL分类二、了解Redis三、Redis的单节点安装教程四、Redis的常用命令五、BITMAP位图 六、Redis的数据模型 七、Redis持久化八、idea使用Jedis连接Redis原创 2021-08-25 13:47:05 · 220897 阅读 · 168 评论 -
硬核整理四万字,学会数据库只要一篇就够了,盘它!MySQL基本操作以及常用的内置函数汇总整理
一、简单了解数据库(1)什么是数据库,数据库其实就是数据的仓库,数据库和普通文件系统的区别(3)数据库分类(4)什么是关系型数据库(5)什么是非关系型数据库二、SQL语句的基本操作三、SQL常用的内置函数原创 2021-08-11 20:29:47 · 4025 阅读 · 28 评论 -
大数据学习日常小练习题汇总收纳
仅供学习交流使用一、选择题1.下面哪个程序负责 HDFS 数据存储。A、NameNodeB、JobtrackerC、DatanodeD、secondaryNameNode答案:C2.HDFS 中的 block 默认保存几份?A、3份B、2份C、1份D、不确定答案:A3.hadoop2.x版本之后 HDFS 默认 Block Size。A、32MBB、64MBC、128MBD、256MB答案:C4.大数据集群的主要瓶颈是A、CPUB、网络C、磁盘IOD、内存答原创 2021-06-22 12:00:25 · 7645 阅读 · 0 评论 -
【Scala】Day03---函数篇
一、函数的种类1 .成员函数成员函数︰函数被使用在类的内部,作为类的一份子,称为类的成员函数2.本地函数(内嵌在函数内的函数)本地函数:定义到函数内部的函数叫本地函数3.函数值(匿名函数)4.高阶函数二、函数的声明和调用1.scala通过 def 关键字来定义一个函数格式: def 函数名(参数列表): 返回值类型 = { 方法体 }2.scala可以自动推断出函数的返回值类型3.scala使用自动推断时,函数必须有等号;否则函数返回值都是Unit空类型4.声明函数时默认的访问原创 2021-06-20 00:14:21 · 1258 阅读 · 0 评论 -
【Scala】Day02---Scala基础语法
1.变量和常量2.字符串常用方法3.Int类型常用操作方法原创 2021-06-05 15:27:10 · 1320 阅读 · 2 评论 -
【Scala】Day01---了解Scala
一、什么是Scala?Scala既是面向对象的语言,也是面向函数的语言。scala可以为你在做大量代码重用和扩展时提供优雅的层次结构,并可以通过高阶函数来实现这样的目的原创 2021-06-05 08:53:53 · 1200 阅读 · 0 评论 -
hdfs shell介绍 以及 常用命令介绍
hdfs shell调用文件系统(FS)Shell命令应使用 bin/hdfs dfs -xxx 的形式。所有的FS shell命令使用URI路径作为参数。URI格式是scheme://authority/path。HDFS的scheme是hdfs,对本地文件系统,scheme是file。其中scheme和authority参数都是可选的,如果未加指定,就会使用配置中指定的默认scheme。例如:/parent/child可以表示成hdfs://namenode:namenodePort/pa原创 2021-05-23 16:06:04 · 1458 阅读 · 0 评论 -
hadoop入门简介
1.什么是hadoop ?概述:Hadoop是一个适合海量数据的分布式存储和分布式计算的平台。背景:作者Doug Cutting 受Google三篇论文的启发,开发了hadoop。2.hadoop组件的介绍(三大组件)hdfs:是一个分布式存储框架,适合海量数据存储mapreduce:是一个分布式计算框架,适合海量数据计算yarn:是一个资源调度平台,负责给计算框架分配计算资源3.hadoop的特点扩容能力(Scalable):能可靠(reliably)地存储和处理PB级别的数据。原创 2021-05-23 15:27:34 · 1439 阅读 · 2 评论 -
Linux自学、大数据学习前奏笔记---Linux基础知识,shell命令介绍学习
大数据学习之Linux基础知识储备Linux是一个自由的,免费的,源码开放的操作系统。Linux与Unix的对比:1、Linux思想源于Unix进行开发。2、Linux属于开源免费软件,公开内核源代码。而Unix属于闭源收费软件。3、Linux可以自由安装,支持绝大部分硬件平台,而Unix通常和硬件进行配套,比如Sun公司的Solaris。4、使用上Linux相对简单,Unix较为复杂。5、Linux也有商业化的版本,比如RedHat、SuSe、红旗等。Linux的目录结构:linu原创 2021-05-21 18:02:55 · 1467 阅读 · 4 评论 -
50道HIVE练习题-搞定了这50题hive sql,那可不嘚直接通关起飞!!!
大数据自学之hive通关宝典秘籍超详细的练习过程,赶紧收藏吧!》》》》》》》》持续跟新中现有这样几张表及对应数据,请建好表并插入数据Student(Sid,Sname,Sage,Ssex)学生表Sid:学号Sname:学生姓名Sbirth:学生生日Ssex:学生性别Course(Cid,Cname,T#)课程表Cid:课程编号Cname:课程名称Tid:教师编号SC(Sid,Cid,score)成绩表Sid:学号Cid:课程编号score:成绩Teacher(Tid,Tn原创 2021-05-18 23:33:22 · 9901 阅读 · 7 评论 -
Windows下Hadoop的环境变量的配置以及Hadoop的配置文件修改
Hadoop的环境变量的配置1.进入系统变量,右键单击我的电脑 –>属性 –>高级环境变量配置 –>高级选项卡 –>环境变量 –> 单击新建HADOOP_HOME2.在系统变量path 里面 添加 %HADOOP_HOME%\bin;3.测试:打开命令行cmd ,在任意路径下输入hadoop命令,返回一下结果即配置正确修改hadoop配置文件1.编辑并保存“D:\Program Files\hadoop-2.7.2\etc\hadoop”下的core-site.xm原创 2021-05-11 16:52:31 · 3735 阅读 · 0 评论 -
Hadoop集群搭建完全分布式搭建---------虚拟机版本
大数据自学——之Hadoop集群搭建分布式安装小白超详细安装教程小蜡笔的安装工具:VMwara(以管理员身份运行哦)、Xshell、Xftp**一、准备工作:***1.虚拟机安装三台linux 本次测试是 Centos 6.5,(三台虚拟机的系统时间保持一致) 安装第一台虚拟机,并将该虚拟机默认设为主节点,小蜡笔命名为:master(1)*配置主机ip(2)*修改主机名命令: vim /etc/sysconfig/n.原创 2021-04-24 01:13:14 · 1498 阅读 · 2 评论 -
Hive1.2.1 && MySQL5.1.73-1 安装 小白超详细安装教程
大数据自学之Linux虚拟机Centos下的Hive1.2.1安装MySQL5.1.73-1安装小白学习超详细安装教程小新用的工具:VMware 、CtenOS6.5、Xshell、Xftp(这里是小新自学时用的软件哦!不是必要的哦,可以根据自己喜爱选择其他软件。)一、 MySQL的安装1、查看mysql的依赖rpm -qa | grep mysql2、删除mysql的依赖rpm -e --nodeps ‘rpm -qa | grep mysql‘ 或者rpm -e --node.原创 2021-04-21 22:15:17 · 2145 阅读 · 11 评论