江心洲
码龄5年
关注
提问 私信
  • 博客:5,604
    动态:1
    5,605
    总访问量
  • 12
    原创
  • 1,912,947
    排名
  • 9
    粉丝
  • 0
    铁粉

个人简介:一步步努力,希望25岁可以进入大厂

IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:江苏省
  • 加入CSDN时间: 2019-12-02
博客简介:

weixin_45959865的博客

查看详细资料
个人成就
  • 获得9次点赞
  • 内容获得2次评论
  • 获得53次收藏
创作历程
  • 11篇
    2023年
  • 1篇
    2022年
成就勋章
TA的专栏
  • hadoop
    1篇
  • Maven
    2篇
  • JAVA
    1篇
兴趣领域 设置
  • 大数据
    mysqlhadoophiverediszookeepersparkflumekafkaflink大数据数据仓库
创作活动更多

HarmonyOS开发者社区有奖征文来啦!

用文字记录下您与HarmonyOS的故事。参与活动,还有机会赢奖,快来加入我们吧!

0人参与 去创作
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

怎么保证从kafka读取数据为顺序读取

当时是电话面试没有想到太多,就这么说了,挂了电话后想这这种方法是不行的。后面想到了,应该根据业务的划分,在不同业务的数据前加上不同的key(相同的业务key相同),因为kafka的分区是通过key的hashcode值来选择分区的,所以我们将不同业务的数据分发到不同的分区,这样可以保证数据吞吐量的增加,也保证了消费数据的一致性。
原创
发布博客 2023.08.15 ·
266 阅读 ·
0 点赞 ·
1 评论 ·
0 收藏

Hive学习

hive是基于hadoop的数据仓库建模工具之一,hive可以使用类sql方言,对存储在HDFS上的数据进行分析和管理。元数据包括表名、表所属的数据库(在hive中默认的数据库为default)、表的拥有者、列/分区字段、表的类型(是否是外部表)、表的数据所在的目录等。Hive本质是将sql转换为mr的任务进行运算的,底层是由HDFS来提供数据存储的,说白了就是将sql转换为mr任务的一个工具。4、hive优势在于处理大数据,对于小数据没有优势,因为hive的执行延迟性较高(因为会不断的开关jvm虚拟机)
原创
发布博客 2023.05.10 ·
156 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Hadoop的优化

这里我们以查询某一年、某一个月的最高温度//随机生成温度代码//创建日期格式i < 10000;i++) {//随机生成时间2000-2023//随机生成一个温度//打印生成的结果。
原创
发布博客 2023.04.26 ·
180 阅读 ·
2 点赞 ·
0 评论 ·
1 收藏

Hadoop中MapReduce和Yarn相关内容详解

根据Key直接计算出对应的Reduce,分区的数量和Reduce的数量是相等的,hash(key) % partation(reduce的数量) = num,默认分区的算法是Hash然后取余,Object的hashCode()—equals(),如果两个对象equals,那么两个对象的hashcode一定相等,如果两个对象的hashcode相等,但是对象不一定equlas。将内存中的数据循环写到硬盘,不用担心OOM问题,每次会产生一个80M的文件,如果本次Map产生的数据较多,可能会溢写多个文件。
原创
发布博客 2023.04.19 ·
228 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Hadoop中的HDFS相关内容详解

hadoop是一个适用与海量数据的分布式存储和分布式计算的平台。HDFS(Hadoop Distributed FileSystem)是Hadoop自带的一个分布式文件系统,同时HDFS也是MapReduce计算的基础。
原创
发布博客 2023.04.12 ·
154 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

HADOOP的完全分布式搭建保姆级教会

此前写过一个hadoop的伪分布式的搭建,前几天刚刚帮别人搭了一个完全分布式的,今天就把完全分布式的搭建也给写出来,给大家做个参考。前期搭建的时候有一些准备工作需要我们去完成。
原创
发布博客 2023.04.05 ·
89 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

Maven的核心概念

继上篇,我们安装好Maven后,具体要怎么使用它呢,Maven有哪些注意事项呢,有哪些核心要点呢,我在这篇博客中将自己所理解的一些知识分享给大家,同时也是自我回顾一下。
原创
发布博客 2023.03.29 ·
65 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Maven的超详细安装步骤

Maven字面意思:专家、内行Maven是一款自动化构建工具,专注服务于Java平台的项目构建和依赖管理。依赖管理:jar之间的依赖关系,jar包管理问题统称为依赖管理项目构建:项目构建不等同于项目创建项目构建是一个过程【7步骤组成】,项目创建是瞬间完成的清理:mvn clean编译:mvn compile测试:mvn test报告:打包:mvn package安装:mvn install。
原创
发布博客 2023.03.29 ·
1213 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

Java基础语法IF和SWITCH

对应的case的值,那么就执行其中的语句体,直到遇到了break结束,整个语句如果都没有对应的case匹配,那么会最终执行default中的语句体,直到遇到break,从而结束整个switch语句。下面我们来写一个switch的简单列子,这是我作为初学者写的例子,我自己认为还是很好帮助初学者来理解这个函数的。答案是可以的,严格按照执行流程来执行。上面所写的执行语句中,是先计算表达式中的值,然后拿着这个值去匹配对应的case,如果 匹配到。答案也是可以的,但是一般来说为了程序的严谨性,还是需要协商的。
原创
发布博客 2023.03.08 ·
156 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

CentOS7上安装MySQL数据库

发布资源 2023.02.19 ·
zip

CentOS7克隆虚拟机及配置IP地址

1. 克隆虚拟机1、关机 (PS 这里我们要将所克隆的虚拟机关机才能克隆,这样所占磁盘会小很多)2、右键虚拟机----> 管理--->克隆 3、选择完整克隆(和hadoop01就没有关系了)
原创
发布博客 2023.02.17 ·
2563 阅读 ·
6 点赞 ·
1 评论 ·
47 收藏

力扣第一题《两数之和》

给定一个整数数组 nums 和一个整数目标值 target,请你在该数组中找出 和为目标值 target 的那 两个 整数,并返回它们的数组下标。你可以假设每种输入只会对应一个答案。但是,数组中同一个元素在答案里不能重复出现。你可以按任意顺序返回答案。
原创
发布博客 2023.02.12 ·
49 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

hadoop的伪分布式搭建

Hadoop伪分布搭建
原创
发布博客 2022.12.23 ·
485 阅读 ·
1 点赞 ·
0 评论 ·
2 收藏