xiaochen_bigdata
码龄3年
关注
提问 私信
  • 博客:22,011
    22,011
    总访问量
  • 13
    原创
  • 2,046,330
    排名
  • 12
    粉丝
  • 0
    铁粉

个人简介:初入大数据的小菜鸡

IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:安徽省
  • 加入CSDN时间: 2021-12-11
博客简介:

xiaochen_bigdata的博客

查看详细资料
个人成就
  • 获得4次点赞
  • 内容获得2次评论
  • 获得52次收藏
创作历程
  • 11篇
    2022年
  • 2篇
    2021年
成就勋章
TA的专栏
  • 数据科学与大数据技术
    8篇
  • 前端学习
    1篇
  • 数据库
    1篇
  • 数据集成工具
    2篇
创作活动更多

超级创作者激励计划

万元现金补贴,高额收益分成,专属VIP内容创作者流量扶持,等你加入!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

Hive基础概念和基础操作

目录一.基础概念1.概述2.组成架构3.特点4.hive和传统数据库区别比如mysql二.基础操作常用命令1.进入hive数据库2.查看某个数据库3.进入某个数据库4.查看所有表5.显示表结构6.查询表数据7.显示表名的分区8,创建数据库9.删除数据库10.创建数据表11.加载数据列表12.重命名表13.删除表14.插入表数据15.表结构修改16.分桶表17.创建一个视图数据仓库(Data Warehouse)工具基于Hadoop的将 结构化的数据文件 映射成一张表提供了类SQL的HQL的查询功能
原创
发布博客 2022.07.06 ·
1505 阅读 ·
1 点赞 ·
1 评论 ·
6 收藏

nodejs安装和环境变量配置

1.下载node.js下载地址:Node.js2.安装点击next下一步直接安装就可以了。在配置安装目录的时候可以选择自己想要安装的目录。3.配置环境变量在你安装路径根目录下创建文件夹node_cachenode_global打开cmd配置路径npm config set prefix "F:
odejs
ode_global"npm config set cache "E:
odejs
ode_cache"在此电脑下找到属性-》高级系统设置-》环.
原创
发布博客 2022.05.25 ·
270 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Class not found 问题怎么解决

查看jar包是否出问题,target下是否有所需要打包的代码,如果没有,再pom文件中添加相关插件重新打包就可以了
原创
发布博客 2022.04.13 ·
1023 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

hive启动元数据管理命令

nohup hive --service metastore 2>&1 &
原创
发布博客 2022.04.07 ·
2960 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Scala语言I/O正则表达式

1. Scala I/O操作简介I/O操作是一门编程语言中的重要内容,在Scala中,它更多的是调用java中的I/O类或者通过对java中的I/O类进行相应的封装来实现I/O操作。在上一节内容中我们已经用到了I/O操作:trait FileLogger extends Logger{ val fileName:String //PrintWriter使用的是java.io.PrintWriter类 val fileOutput=new PrintWriter(fileName:Str...
原创
发布博客 2022.04.02 ·
144 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Hadoop中MapReduce深入理解和优化以及Yarn的介绍

什么是MapReduce你想数出一摞牌中有多少张黑桃。直观方式是一张一张检查并且数出有多少张是黑桃。MapReduce方法则是:1.给在座的所有玩家中分配这摞牌2.让每个玩家数自己手中的牌有几张是黑桃,然后把这个数目汇报给你3.你把所有玩家告诉你的数字加起来,得到最后的结论MapReduce概述MapReduce是一种分布式计算模型,由Google提出,主要用于搜索领域,解决海量数据的计算问题.MapReduce是分布式运行的,由两个阶段组成:Map和Reduce,Map阶段是一个独立
原创
发布博客 2022.02.20 ·
870 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Flume总结

他是一个高可用的,高可靠的,分布式的海量日志采集,聚合和传输的系统。flume是流式架构,flume最主要的作用就是实时读取服务器本地磁盘的数据,将数据写入到HDFS中去。他的一个组成架构Web端=》source=》channel=》sink=》HDFStaildir source1、间断性的传输文件,可以监控一个目录下多个目录文件2、flume是在Apache1.7,CDH1.6产生的3、没有断点续传功能怎么实现,可以通过自定义的方式4、taildir挂了怎么办,重启但是会导致数据重复
原创
发布博客 2022.02.20 ·
1050 阅读 ·
1 点赞 ·
0 评论 ·
2 收藏

什么是MyISAM与InnoDB和两者的区别

MyISAM是MySQL关系数据库管理系统的默认储存引擎。它从旧的ISAM代码扩展出许多有用的功能。在新版本的MySQL中,InnoDB引擎由于其对事务,参照完整性,以及更高的并发性等优点开始广泛的取代MyISAM。InnoDB是MySQL的另一个存储引擎,正成为目前MySQL AB所发行新版的标准,被包含在所有二进制安装包里。较之于其它的存储引擎它的优点是它支持兼容ACID的事务(类似于PostgreSQL),以及参数完整性(即对外键的支持)。两者区别1. InnoDB支持事务,MyISAM不
原创
发布博客 2022.02.18 ·
515 阅读 ·
0 点赞 ·
0 评论 ·
5 收藏

Flink、Kafka梳理

flink和kafka梳理
原创
发布博客 2022.02.16 ·
7803 阅读 ·
2 点赞 ·
1 评论 ·
23 收藏

Hadoop中HDFS基本操作

HDFS基本操作命令
原创
发布博客 2022.02.04 ·
1897 阅读 ·
1 点赞 ·
0 评论 ·
12 收藏

Hadoop的介绍和安装

Hadoop的组成架构和安装
原创
发布博客 2022.02.04 ·
1393 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

DataX的安装和使用

Datax的安装及使用
原创
发布博客 2021.12.14 ·
2385 阅读 ·
0 点赞 ·
0 评论 ·
3 收藏

sqoop的安装和使用

sqoop的安装和使用
原创
发布博客 2021.12.14 ·
197 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏