自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(368)
  • 资源 (13)
  • 收藏
  • 关注

原创 秋招面经第十三弹:58同城一面-大数据开发工程师

总结:这次面试感觉面试官有点腼腆,问题并不是特别难,对于技术八股问的不多,对于一些网络、操作系统也是没问,但是对于项目和对数据仓库的理解问的比较多,可能面试官比较注重面试者的独自思考能力,问了我对数据域、开发流程的一些自己的见解和觉得不足的地方。写在最前:秋招以来一直在冲,因为事情比较多,对于笔试面试一直没有复盘,现在靠仅存的记忆把面试的一些问题记录下来,尽可能记录出能回忆到的问题,但可能记的不是很全。对于公司的分层,有一些自己的想法吗?存储的数据太大的时候,有什么方法降低存储吗?数据域是怎么划分的?

2022-12-02 06:00:00 168 4

原创 秋招面经第十二弹:东方航空一面-数据工程师

总结:虽然这次面试有点摆烂,而且面试行式有点不伦不类的,把技术面和hr面直接放在一起,但是我个人是比较喜欢这种行式的,一次性面完,绝不拖泥带水,不用担心一面结束等二面,二面结束等三面,而且面试的内容感觉来说也还可以接受,虽然是航空公司,但是面试的内容感觉他们确实在做数据开发,和开发岗也比较吻合,虽然hr有些咄咄逼人的感觉,但是技术面试官还是很温和的,不会特别强硬的问问题。hr先介绍了面试流程,说总共四个流程,先自我介绍,在hr问问题,再技术面问题,再由我反问。我回答,回家坐过你们的飞机,其他的不是很了解。

2022-12-01 06:00:00 116

原创 秋招面经第十一弹:沐瞳科技一面-大数据平台开发工程师

总结:因为是平台开发,对于后端开发的能力确实有限,java的问题回答的并不好,但是在问spark源码时候的方式很独特,可以真实的去考虑sql是怎么提交的,比着回答八股文,对了一些灵活性,而且分析代码得出结论的方式更能学到东西,总体来说,虽然java的问题回答的一探糊涂,但是大数据相关的面试经验又多了一些。这种源码的考察方式很独特,编都没法编,就仔细的分析了一下代码,把行动算子和shuffle算子罗列了一下,和面试官说了job和stage的数量,顺遍说了下job和stage底层是怎么划分的,拖延下时间。

2022-11-30 06:00:00 343

原创 秋招面经第十弹:字节跳动二面-大数据开发工程师(电商)

总结:二面的面试官有点老板风范,过程中不知道是在干其他事情,还是在记录我的面试情况,有时候会眼神在屏幕扫荡,面试问题比较针对于真实生产环境,对于没有实习经验的小伙伴可能不太友好,而且对项目问的也比较全面,一大半的时间都在问项目,总之,整体来说难度和体验都还可以。在这里我找到一个诀窍,能写代码的,尽量写代码,因为写代码比着口述,第一是可以让面试官融入自己的情感,知道你的处理逻辑,第二就是写代码就表现的很自信,因为大家都是尽量少些,而你主动去写,反向面试,惊呆面试官。开始死问项目,问的很细,怎么做的?

2022-11-29 06:00:00 323

原创 秋招面经第九弹:字节一面-大数据开发工程师(电商)

总结:字节的面试可能是一面的原因,整体感觉还可以,甚至给一种感觉没有一些小公司的难,但考察的面还是挺广的,对于底层的东西和基础的东西字节问的还是比较多,算法出了两个,本人的算法能力巨弱,好在出的比较简单,答得也比较顺利。写在最前:秋招以来一直在冲,因为事情比较多,对于笔试面试一直没有复盘,现在靠仅存的记忆把面试的一些问题记录下来,尽可能记录出能回忆到的问题,但可能记的不是很全。java的内存模型?面试官可能看我比较紧张,说缓解一下我的紧张情绪,下面正式开始,当时听完,更紧张。hive的udf怎么自定义的?

2022-11-28 06:30:00 197

原创 秋招面经第八弹:网易二面-数据开发工程师

总结:网易的面试整理来说还是有些难度的,有很多很深的问题,现在实在是想不出来了,只记得当时脑瓜子嗡嗡的,面试官也挺好,开始他做了自我介绍,应该是数据团队的负责人或者组长,当时走神了,全程一直在微笑,也没有不尊重面试者的表现,不像某些面试官期间会做其他的事情,一直等你回答完问题在说话,不会打断你,总之,收获还是挺多的,比较nice。写在最前:秋招以来一直在冲,因为事情比较多,对于笔试面试一直没有复盘,现在靠仅存的记忆把面试的一些问题记录下来,尽可能记录出能回忆到的问题,但可能记的不是很全。

2022-11-27 06:00:00 365

原创 秋招面经第七弹:网易一面-数据开发工程师

总结:网易一面其实还算友好,没有太刁难的问题,面试官也比较和善吧,因为时间太久确实想不起来这个面试的太多问题,可能不是很全,只回忆了几个比较记忆深刻的问题,见谅见谅。写在最前:秋招以来一直在冲,因为事情比较多,对于笔试面试一直没有复盘,现在靠仅存的记忆把面试的一些问题记录下来,尽可能记录出能回忆到的问题,但可能记的不是很全。不同于平常的数据倾斜提问,在我说出来一种加盐处理方式后,问我怎么加盐,我怀疑应该是太多人说这些了,面试官怀疑是背的八股,想看一下是不是真的处理过数据倾斜。项目中用户域是怎么做的?

2022-11-26 06:00:00 378

原创 秋招面经第六弹:理想一面-大数据开发工程师

总结:本次面试问的可以说有史以来最全的了,涉及到了很多的大数据相关的问题,而且又会涉及到源码,问的广度和深度都比较深,而且,面试官不是你回答完就结束了,会根据你的回答接着往下问你,总之这次面试之后感触还是很大的,下来把这些问题都整理了一下,这些问题在大数据面试中的出现频率也相当高了。写在最前:秋招以来一直在冲,因为事情比较多,对于笔试面试一直没有复盘,现在靠仅存的记忆把面试的一些问题记录下来,尽可能记录出能回忆到的问题,但可能记的不是很全。spark的执行流程?stage对于task的分发又是怎么做的?

2022-11-25 06:00:00 256

原创 秋招面经第五弹:一家上市小公司二面-大数据开发工程师

另外,在反问中了解到,现在公司在做数据仓库和数据开发业务时候,招人标准除了技术之外,想要找一些对业务理解较好的同学,通过这些也感受到了在大数据行业其实业务理解能力也是很重要的一环,在其他的面试中也有感受到,大数据行业除了技术外可能还需要有熟练的业务能力,以后也要多关注这些方面。反问时候问了岗位匹配度和岗位的工作内容,其实这个公司做的数据和政府数据有关,数据体量很大,但是政府部门多半不会用,所以工作内容对接的多是政府数据。这种问题,说一下影响范围较大的,但是结果没有恶劣影响的,而且自己解决的很完美的。

2022-11-24 06:00:00 235

原创 秋招面经第四弹:一家上市小公司一面-大数据开发工程师

这个问题一出来,我直接笑出了声,像这种问题,没有明确的主题,问项目怎么做的,那从开始到最后不得抓住机会好好回答,一口气说了三个项目的完成过程,浪费了大量时间,看时间用了挺多,就和面试官说我先介绍这三个,如果后续你想了解其他的,我再介绍。总结:这次面试可能是面试官第一个问题提问草率,我回答的时间太久了,以至于后面都没有多少时间问问题了,整体下来难度不大,都比较容易回答,也没有涉及太难的问题,但是从面试中和反问中可以感觉到他们使用的技术还是挺新的,总体感觉还可以。项目中的一些问题,问怎么做的?

2022-11-23 06:00:00 187 1

原创 秋招面经第三弹:oppo一面-大数据开发工程师

总结:整体下来面试问题的难度并不是很大,涉及的面也比较广,对于大数据的组件、还有一些项目问题,面试官应该也是一晚没睡想的这些题目,复盘的价值也是很高的。写在最前:秋招以来一直在冲,因为事情比较多,对于笔试面试一直没有复盘,现在靠仅存的记忆把面试的一些问题记录下来,尽可能记录出能回忆到的问题,但可能记的不是很全。问了几个情景问题,问如果数据出现了告警,怎么快速处理?问项目,问的不深,大概一些设计的数据类型、业务线、业务逻辑怎么处理的、怎么处理的脏数据、模型怎么设计的?平时用的比较多的引擎有哪些?

2022-11-22 06:00:00 232

原创 秋招面经第二弹:百度一面-大数据开发工程师

这个面试官一看就是大佬级别的,上来压迫感很强,问的很细,就差问我代码怎么写的了,差不多项目问了有40min,一直在探讨项目实施中的细节,还有一些数据规模,业务过程,面向的用户等等,总之是康师傅都没他细。我说我的时间可能不多了,但是面试官好像对我比较感兴趣,说前面聊的都可以,现在就是要考察一下你的代码能力,再聊会。其实两个星期后百度hr打电话给我问了我的秋招情况,我说还没有签其他的,他说面了一轮下来,其没有更合适的了,面试官觉得我还行,想再约下一轮的面,我心里直接问候一万遍,然后果断拒绝。

2022-11-21 06:00:00 255 1

原创 秋招面经第一弹:百度一面-大数据开发工程师

此sql是灰常变态了,实现一个漏斗分析,开始还平平无奇,用sql实现了之后,面试官开始了升级,让写scala实现,我说写的可能不是很完整,可以把大概思路写出来,面试官说可以,我写了大概之后,面试官再次升级,写udf可以实现吗?说实话这个操作给我问蒙了,没见过上来就介绍他们的工作内容的,后面想想应该是我在介绍中说了自己不能接受的一些工作内容,面试官介绍了一下自己的。问了这次面试结果什么时候出来,面试官说给你约个下午的二面,但是好像他们的面试系统出了问题,他们约的容易重复,就让hr约了一个二面事件。

2022-11-20 22:35:38 616

原创 MyBatis-Plus入门使用小案例

入门的MyBatis-Plus小案例,结合SpringBoot

2022-11-06 17:51:15 220

原创 mysql更改自定义存储数据目录

数据表的存储路径在my.ini文件的dataDir配置中basedir为默认安装目录datadir为数据存储目录可以看到在修改之前数据是默认存储在c盘的隐藏目录下的注意:在自定义存储目录之后,因为mysql内有许多配置表,存放在默认的data路径下,如果更改了目录,需要把这些默认的问价copy到新的目录下,否则重启时候会失败,因为加载不了mysql的配置文件表修改之后,重启MySQL,创建数据就检测一下是否更改了目录检查新的目录是否有这条数据修改成功。

2022-10-16 00:49:54 195

原创 动态规划题:最长回文子串、接雨水、正则匹配

返回一个二维数组,代表了不同开始和结束的组合是否为回文子串。如果一个字符串:abcba。判断一个回文子串的方法。

2022-10-05 16:00:52 109

原创 三道动态规划题-最长的有效括号、组合总和I、组合总和II

这种需要的是监测")“,比如i的位置是”)“,那么i-1的位置如果是”(",就说明这个i位置长度为2,然后去看是否有i-2位置,然后加上i-2位置的数就是结果。和上个题目不同,使用简单的递归+回溯的时候,会存在有重复结果的情况,比如[3,4], target = 7,那么,得到的结果就是[3,4],[4,3],造成了重复。给定一组数字,不重复,给定一个target,有多少组合使得他们的和为target,数组中的数字可以重复使用。2.rest

2022-09-30 02:07:49 295

原创 算法必备—动态规划详解,从递归到动态规划

动态规划从简单的地方说起,最初的时候可以理解为循环问题,就是常说的递归,我们仔细的想一想,如果一个问题能够使用递归得到解,那么只要在递归过程中有重复的计算,都可以换做动态规划来解决。那么在每次调用的时候,方法中都夹带着这个缓存表,如果调用的方法已经被计算过了,就从缓存表里拿结果,如果没有,就计算。可以将递归理解为栈结构,当主递归进去后,就是方法入栈,一直递归调用,知道最后一个递归方法全部进栈,开始出栈回溯。上述的递归解法中,因为在递归调用的过程中,会存在重复计算的过程,所以使用一个缓存表,记录每次的结果。

2022-09-04 21:49:33 447

原创 HIVE自定义UDTF函数

其实就是将参数列表封装成了StructObjectInspector对象,如果想要校验参数,那么通过上述的方式,可以看到,调用getAllStructFieldRefs方法,获取所有的输入列列表,遍历就可以取到参数列表了。HIVE提供了丰富的内置函数,但是对于一些复杂逻辑还是需要自定义函数来实现,对此,HIVE也提供了一些自定义的接口和类。注意在UDTF函数中,会出现传入数据异常的问题,在这里我并没有校验参数,在实际生产中是需要校验参数的。UDAF:多进一出,多对一的关系数据。顾名思义,打扫干净,下一位。

2022-09-02 21:43:54 556

原创 HIVE自定义UDAF函数

/ 确定各个阶段输入输出参数的数据格式ObjectInspectors public ObjectInspector init(Mode m , ObjectInspector [ ] parameters) throws HiveException;// 保存数据聚集结果的类 abstract AggregationBuffer getNewAggregationBuffer() throws HiveException;...

2022-08-31 23:38:54 801

原创 HIVE多维分析函数:grouping sets、cube、rollup

这里with cube就等同于grouping sets ((department,name,age),(department,name),(department,age),(department),(name,age),(name),(age),())HIVE的多维分析函数,配合group by 使用,通常的group by只能对单维度的字段进行分析聚合操作,如果想要获取不同组合字段的聚合操作,就需要写多个group by 组合,HIVE提供了内置的函数用于上述这种多维分析。...

2022-08-29 22:36:23 861

原创 sql中常用到的正则表达

iignore,不区分大小写。mmultiline,多行匹配。s使用.时包含换行符\n。gglobal,全局匹配。

2022-07-31 21:32:44 277

原创 java中的Stream类的使用

简单来说,Stream就是java中用来模拟流数据的一种方式,它不是一种数据结构,也不是i一中内部存储,只负责抓去数据,也不会变更底层数据。提供的一些方法可以模拟sql进行快速的数据处理,也可以类比为大数据中的MR处理,和scala中的算子有着异曲同工的意思。因为Stream.of()是调用的Arrays.stream(),那么这个方法也可以返回一个Stream类的对象。类似于reduce,可以传入第一个参数为种子值,也可以说是初始值,然后第二个参数传入迭代值。...

2022-07-31 21:30:48 146

原创 HIVE存储格式和压缩方式详解

引用:https://blog.csdn.net/yizhiniu_xuyw/article/details/113811001LZO压缩算法特点:SNAPPY压缩算法特点:尽管 Snappy 应该相当轻便,但它主要针对 64 位 x86 兼容处理器进行了优化,并且在其他环境中运行速度可能较慢。BZIP2压缩算法特点:HIVE的压缩格式压缩可以存在很多地方,在mr任务运行时候,map端溢写到磁盘,以及reduce端从磁盘中拉取文件,都有大量的IO操作,都可以设置压缩方法。设置压缩格式的参数如下所示HIVE配

2022-07-11 22:37:25 643 2

原创 剑指offer03:找出数组中重复的数字,ArrayList和HashMap的使用区别及源码分析

在一个长度为 n 的数组 nums 里的所有数字都在 0~n-1 的范围内。数组中某些数字是重复的,但不知道有几个数字重复了,也不知道每个数字重复了几次。请找出数组中任意一个重复的数字。示例 1:限制:今天在刷算法题的时候,刷到了一道剑指offer,题目难度为简单,但是里面有些东西确实我之前没有注意过的。现在梳理一下先讲一下这道题,题目很简单,判断数组中有重复的数字,可能存在多个解首先这个题目我看到之后的反应,因为没有提到数组是有序的,所以只能是循环遍历,如果有重复的就返回即可,无重复接着遍历下一个。问

2022-07-10 15:49:00 89

原创 Hadoop HDFS 的shell命令

下面介绍几个常用的命令-help如果对于某个命令不熟悉,想要知道具体的用法,可以使用 --help命令查看比如:查看ls的命令使用说明二、上传文件-moveFromLocal:从本地剪切粘贴到 HDFS-copyFromLocal:从本地文件系统中拷贝文件到 HDFS 路径去-put:等同于 copyFromLocal,生产环境更习惯用 put-appendToFile:追加一个文件到已经存在的文件末尾三、下载文件-copyToLocal:从 HDFS 拷贝到本地-get:等同于

2022-07-10 07:00:00 168

原创 sql中常用的正则匹配

字符中能匹配到就返回1,不能匹配到就返回02.符号’^’代表开头,需要开头是某个字符3.符号’$’代表结尾,需要结尾是某个字符4.符号’.’代表任意一个字符,可以匹配上任何一个字符5.符号’+’前面的字符至少出现1次6.符号’*’前面的数字至少出现0次7.符号’?’前面的数字最多出现1次8.符号’()’代表一个整体,全体匹配9.符号’[]’匹配符号内的任何一个字符即可注意:如果想要匹配字符’[’ 或者’]‘,需要把’[‘放在’]‘前,匹配’]'也是同理符号[]中可以使用’

2022-07-09 12:17:47 3234 1

原创 HIVE内置函数strToMap --源码解析

所在的类:org.apache.hadoop.hive.ql.udf.generic.GenericUDFStringToMapHIVE实现的内置函数功能是可以传入三个参数:举例:输出:那么HIVE是如何实现的?二、evaluate方法该方法涉及到的两个知识点可以看到是一个接口中声明了这个方法,那么一定有实现的地方传入一个object,返回一个object,可以看作是一个object的转换器可以看到,传入一个切割字符,传入一个limit参数,这个是限制切割的数组长度,比如是2,那么切割出来的

2022-07-06 22:45:30 273

原创 HIVE如何校验map类型数据 -- 比较json和map的转换前后数据一致性

HIVE如何校验map数据对于json转map之后,通过转换前的json和转换后的map做checksum是不可行的,因为两者结果差别还是挺大的结果:二、思路那么对于json转map后的checksum应该怎么做?或者如何确定转换的结果没有错?采用的方法是通过get_json_object和element_at方法来确定转换前后结果是否又误。将转换后所有的map结果的key提取出来然后和转换前后的json和map进行关联提取每个key数据关联求解实现方法2上面上个方法虽然可以得解,但是有一些很

2022-07-05 07:30:00 270

原创 JSON转MAP前后数据校验 -- 自定义UDF

检查参数:initialize方法二、evaluate方法处理逻辑:evaluate方法三、测试打包上传集群,创建测试函数测试1:测试2:

2022-07-05 07:00:00 64

原创 HIVE内置函数hash() -- 源码解析

首先HIVE提供的hash()内置函数的源码是怎么要求的?hash内置函数在类中表明:在初始化参数的时候,并没有做任何的校验,直接返回了一个Int类型,所以在编译阶段是可以随意通过的,无论传入什么参数可以看到在处理阶段是可以传入多个参数的,也就是说hash()这个函数可以传入多个参数,其实最主要的处理方法是调用了ObjectInspectorUtils.getBucketHashCode(fieldValues, argumentOIs);getBucketHashCode方法点进去看一下这个方法是

2022-07-04 23:21:20 1096

原创 HIVE内置函数map_keys -- 源码解析

一、initialize方法在上面的源码之后,需要知道返回的列表是怎么执行的,点进去ObjectInspectorFactory类看getStandardListObjectInspector方法其中cachedStandardListObjectInspector的声明如下二、evaluate方法getDisplayString方法getStandardDisplayString的方法:调用了重载方法,一点点的把数组内的数据append到字符中...

2022-07-04 23:15:33 381

原创 HIVE 中的数据类型检查器 -- ObjectInspector 源码详解

HIVE中的数据类型分为了几种:PRIMITIVE, LIST, MAP, STRUCT, UNION;看源码可以看到。一、PRIMITIVE​ PrimitiveObjectInspector​ PrimitiveCategory:二、LIST主要有几种方面理解:主要的实现和常用到的实现接口和类如下:​ StandardListObjectInspector其中接口ListObjectInspector中的getList方法也可以返回一个List类型StandardListObject

2022-07-01 07:00:00 341

原创 sql解决连续登录问题变形-节假日过滤

连续登录天数之前讲解过有两种解法,可以解决连续登录问题,那么在实际生产中也是经常使用到,但是对于一些此类问题的变形,是否能够轻松解决?最近接到一个需求,也不算是需求,是一个小的功能实现。之前一直再做事件告警的需求,需要对告警事件进行反馈,判断是否是当日反馈。最开始实现时候想法很简单,只考虑到了双休日,就设定如果是双休日的告警事件,在周一时候反馈就认为是当日反馈,当时是这么实现的:如果是周六,反馈日期增加2,如果是周日,反馈日期增加1但是在实际使用中,发现了存在节假日的卡点,尤其是上半年的节假日比较多,

2022-06-30 07:00:00 165

原创 HIVE中替换UDF神器-- TRANSFORM()函数

TRANSFORM()以HIVE官网中的一个例子为例讲解一下TRANSFORM函数的使用比如需要对一个时间戳转换为是周几,就是输入一个时间戳,返回这个时间戳是周几。TRANSFORM语法:简而言之,就是从一个表中读取字段,用python脚本处理,然后输出新的字段。那么python脚本怎么使用呢?python中通过sys.stdin来获取输入的字段,然后通过循环处理每一行数据即可处理起来很简单,借助python得天独厚的优点,可以很方便的处理复杂逻辑根据HIVE官方提供的案例,看一下传入字段,调用

2022-06-29 22:38:56 345

原创 ROW_NUMBER()、RANK()、DENSE_RANK区别

ROW_NUMBER()、RANK()、DENSE_RANK区别ROW_NUMBER():排序,不会有重复的排序数值。对于相等的两个数字,排序序号不一致DENSE_RANK():排序,可有重复值。对于相等的两个数字,排序序号一致RANK():排序,可有重复值。对于相等的两个数字,排序序号一致,但是总数会减少如果窗口中over()无排序字段,那么结果如何?数值排序序号111121如果窗口中over()无排序字段,使用的是row_number()排序,结果如何

2022-06-29 22:26:48 1666

原创 Spark源码之Stage的划分

先看一下Stage的规律可以看到只有一个阶段,Stage-0如果是join操作呢?可以看到有三个阶段:Stage-0、Stage-1、Stage-2如果是分组求和操作呢?可以看到有两个阶段:Stage-0、Stage-1去重操作?可以看到有两个阶段:Stage-0、Stage-1这里可以看出来,其实Spark中Stage的划分,好像和一些join、group by、distinct等这些有关系,那么Spark在划分Stage的时候是以什么为区分呢?其实Spark的底层是根据RDD的血缘依赖

2022-06-06 22:04:09 379

原创 Spark源码之组件间通信(Driver <==> Executor)

因为Linux对AIO的支持并不好,所以Linux采用了Epoll的方式模拟了AIO通信Spark 通讯框架中各个组件(Client/Master/Worker)可以认为是一个个独立的实体,各 个实体之间通过消息来进行通信。Endpoint(Client/Master/Worker)有 1 个 InBox 和 N 个 OutBox(N>=1,N 取决于当前 Endpoint 与多少其他的 Endpoint 进行通信,一个与其通讯的其他 Endpoint 对应一个 OutBox),Endpoint 接收到的

2022-06-05 14:10:05 170

原创 Spark源码之任务提交流程

执行脚本提交任务,实际是启动一个 SparkSubmit 的 JVM 进程;SparkSubmit 类中的 main 方法反射调用 YarnClusterApplication 的 main 方法;YarnClusterApplication 创建 Yarn 客户端,然后向 Yarn 服务器发送执行指令:bin/java ApplicationMaster;Yarn 框架收到指令后会在指定的 NM 中启动 ApplicationMaster;ApplicationMaster 启动 Driver 线程,执

2022-06-04 22:14:07 479

原创 HIVE SQL编写MR流程,以及JOIN、GROUP BY、DISTINCT的底层执行原理

HIVE SQL编写MR流程,以及JOIN、GROUP BY、DISTINCT的底层执行原理内容目录HIVE SQL编写MR流程,以及JOIN、GROUP BY、DISTINCT的底层执行原理一、编译MR流程二、HIVE SQL 转为 MR 具体原理1. JOIN2. GROUP BY3. DISTINCT一、编译MR流程HIVE SQL编译成MR任务是在COMPILER阶段完成的。大致可以分为6个步骤:词法、语法解析:Antlr 定义 SQL 的语法规则,完成 SQL 词法,语法解析,将 SQL

2022-05-30 07:00:00 491

Sierra-compact-light.tar

ubuntu下使用macos 的主题

2021-08-28

Cupertino-Catalina.tar

ubuntu下使用mac os 的主题

2021-08-28

ubuntu下mysql的安装到卸载.md

ubuntu下mysql的安装到卸载.md

2021-08-06

大数据必学框架-kafka.md

大数据必学框架-kafka.md

2021-08-06

Python必学的NumPy库.md

Python必学的NumPy库.md

2021-08-04

finalshell.exe

一款开源的远程连接软件

2021-08-04

大数据框架-ZooKeeper.md

ZooKeeper笔记

2021-08-04

大数据必学框架-Flume.md

大数据必学框架-Flume.md

2021-08-04

mysql-workbench-community_8.0.23-1ubuntu18.04_amd64.deb

mysql-workbench-community_8.0.23-1ubuntu18.04_amd64.deb

2021-07-04

jdk1.8.0_144.zip

jdk1.8.0_144.zip

2021-07-04

nginx-1.16.1.zip

nginx-1.16.1.zip

2021-07-04

apache-tomcat-10.0.7.tar.gz

apache-tomcat-10.0.7.tar.gz

2021-07-04

VMware-workstation-full-10.0.4-2249910.exe

VMware-workstation-full-10.0.4-2249910虚拟机安装包,可以下载在本机电脑上进行安装使用

2020-09-07

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除