guitarCC-CSDN博客

原创 flink重学计划

2024.09 ~ 2024.11 构建虚拟服务集群天气信息系统流入指标简历。2024.07 ~ 2024.09 征信系统包含征信系统总结。2024.04 ~ 2024.06 重新学习flink课程。2024.06 ~ 2024.07 对接天气系统天气采集。2024.11 ~ 2025.03 整合知识点贯穿项目。这里列举今年的flink学习计划。

2024-04-26 02:57:53 100

我们也陷入了自我反省的牢笼但是法律从来都是让施暴的人犯罪的代价更大让被施暴的人更懂得自我保护。老师人没有足够的野心和应变能力不如说是(伪辩) 反而循规蹈矩的老实的特质错过了很多机会。我觉得老实人本身的思维会固化就觉得这件事情就是这么做的比如是我去找房子。动手又会感觉难过这样的道德感就成为了一个牢笼道德只限制你不限制施暴的人。过多的自我反省本身就是不合理的往往我们并没有做错而是即使有不公平的对待。就会限制你的攻击力被骂被打时告诉这样做是不对的君子动口不动手。

2024-03-18 00:27:55 123

原创学习笔记集群安装

---------Scp ~/eclipse-workspace/SparkWordcount/target/Sparkwordcount-1.0-SNAPsHoT.jar [email protected]: /root2.输入密码运行并登录[email protected] 输入密码。Window->Preferences->Java->|nstalledJREs->Add->standard VM->Next->配置->Finish->勾选新增 jdk->Apply3.//请在此处编写代码。

2024-03-12 22:40:16 804

原创面试八股文这件事情？ 2

第二个就是即便你有经验呢，然后问一些八股文呢，其实也从侧面反映出你对这些你使用过的技术，它在理论层面你就没有花心思去做一些理解。看一个人面试的时候，八股文问的多少，就看你的经验的深浅，经验越多，肯定问的就越少，甚至不问，怎么看待八股文的实际上工作八股文用不到但是经验方面比如您肯定遇到过各种难以解决的问题架构之类的。八股文很多时候是，比如你经验比较浅，没有什么好问的，你说你没有项目经验对吧？即使我spark的调参都是自己写的我也没记住！但是你实际经验越浅，那没有别人问的，那就只能问八股文。

2023-12-19 00:53:50 374

原创脱离工作环境我们能学习吗？

但是本身我是缺乏java的历练的不能和专业的java相比较无论是八股文还是运用和思考的程度。而且本身学习是依靠自觉性的工作通常是被动的本身就是缺乏一个动力的问题。也缺乏运用的过程所以虽然知识度达到了但是掌握和理解的能力是不够的。就像学java 大数据的场景和学习本身就要付出更多的学习代价来成长。而且生产存在的各种问题比如网络资源等等的使用复杂的udf函数。我觉得不太行学习往往局限于学习的场景没有自己的思考和理解。而学习往往是单一的没有解决和面对问题的场景这是很重要的)

2023-12-17 18:58:29 380 1

原创面试八股文这件事情？

而且我的压力不比任何一个人差也就是说我的工作难度还是蛮高的[1]而且我也敢说面试官也用不到这些那我确实不记得了我又不是天天看。我一个人完成了公司整个大数据的构建先不说合不合理这些观点的问题。一方面是大数据面试官自身的局限没有办法衡量我全面的知识。我不差甚至在长达半年的时间里我都是在加班中度过的。所以面试的时候我是比较“痛恨”八股文的大数据方面。就网上的那些知识散落的知识点是远远不够的[2]八股文我又没背我又觉得八股文显示不出来我的能力。

2023-12-13 01:02:19 384 1

原创 java操作数据计算和spark操作数据计算有什么区别吗

这样数据一致并行处理的概念屏蔽了变量本身(包括语言中更多的概念反射流处理等复杂支持) 更倾向于一致性处理 rdd只是一致性数据操作的抽象函数这是已经写好的。在我看来没什么不同都是jvm体系的从代码方向上都是代码的执行逻辑。也不涉及什么分布式的机制封装的机制都只是java集合的代码处理的话。各个任务处理的逻辑往往是相同的并行处理嘛任务发布的都是加法。如果每个数据都有自己的逻辑并行一致性的处理就失去了作用。但是计算逻辑本质上走的都是一样的代码一样的编译器。

2023-12-09 23:15:59 398

原创创业和技术之间的关系(小白)

技术并不是强关系需求这句话的意思是技术好不一定你就比人家强。而诺基亚三星这样的电子大厂也没有在智能手机时代占据一定的优势。很大一部分来着公司自身的战略和风口的交织团队的能力有关。其实相信拥有技术的有能力的远远比创业成功的人多。微软这么强的芯片制造技术也没有拿到手机芯片的风口。就像雷军所说有能力聪明的人努力的人多了去了。但是更重要的如同知乎里说的有一个idea。机会很重要新东方的成功是有留学热潮的背景。什么都没有肯定是不行的有技术当然是好的。

2023-12-09 22:24:52 351

原创如果 java 大数据运维都会怎么办(普通开发)？

公司招一个大数据一个运维一个java 比招一个会大数据+java+运维的能力代价低得多。工作上只是面对应专业的能力而已面试官也是希望用过往的工作职位来评定你的能力。所以面试的时候面试官问你你之前是主要是开发还是运维你说我都干过？你的价值和运维的价值是相同都可以把工作拿下来因为公司就缺运维。所以通常对于一个成体系的状态往往是根据所作的内容区分方向的。就像问你之前主要是前端还是后端你说都是都干都我干。而通常衡量一个人的能力的方式就是过往的工作经验。

2023-12-07 00:09:23 448

原创为什么要面向简历编程(工作)

日常的东西可能操作并不是那么多面试官也不能一眼看出来。尤其是冲面试的时候形成自己第一套坚固的简历和面试说辞。所以面向简历编程更是可以找到一个好的工作的衡量标杆。当然维度跃升很强除外(你真的做了很有用的东西)而且没有八股文一类的东西难以体现出自己的能力。往往我们只是当时记得只做过一次的事情就都忘了。工作是用不到的那么本身就会有遗忘的可能性。所以尤其在这个时候体现记忆的重要性。简历尽可能的第一眼体现了自己的优势。那么就最好形成自己的笔记本。自身偏向于工作记忆为准。毕竟不是天天记这些东西。

2023-12-06 12:39:35 384 1

原创大数据开发学java的加成有多大？

运维也不太care java开发的能力(做的东西就不一样)(虽然也可以说大数据当中有java源码)对一个招后端的来说公司希望这个人java可以搞得定完成的了工作会一些前端很好了。总体来说：大数据会java是有加成的但是面试还是以大数据的技术栈经验和项目为主。你只要能完成 java任务上完成的或者大数据任务上的你就是合格的员工。其实这个标题本身就是有问题的(加成的概念) 首先多学一些东西总是好的。也不能强调运维的经验是不（即使你运维也可以拿下前端什么什么的）

2023-12-03 23:36:38 349 1

原创面试八股文大数据难还是java难？

数仓的构建，而且大数据的框架，其实相当于工具，我们只是使用工具。框架也不如大数据那么多 (像大数据工具很多代码就一套体系是比较友好的)或者刚刚接触的宝子们的一些看法如果比教深入的话那就有的说了。因为本身代码化代码不能速通面试更倾向于问题场景的代码和。简历上的描述也是大数据组件和数据处理流程框架的要点。java虽然本身也是通用的框架体系代码实现层面。大数据的简历内容八股文对比java是有不同的。本身数仓作为一个工具其实是缺少变化和应对场景的。简历上更多的体现是模块和业务的实现。

2023-12-03 22:57:26 446 1

原创大数据和java发展的一些看法

就业环境和市场的看法（小菜鸟）

2023-10-23 18:38:43 35 1

原创读书笔记知乎创业

知乎创业

2023-10-08 13:21:24 40 1

原创对spark进行字符统计和java进行一些对比和思考

对spark进行字符统计和java进行一些对比和思考

2023-06-09 19:39:41 109

原创一个人可以搭建数仓吗

对一个人能不能搭建大数据仓库的思考

2023-02-19 23:44:39 258

原创为什么大数据平台要回归sql 一点点思考

关于大数据平台为什么要回归sql以及当然遇到的问题的一些思考

2022-10-08 13:31:32 711

原创 spark 读取lzo 环境依赖

bug:由于lzo压缩本身不属于hadoop体系自带压缩方式以及spark自带的解析方式，所以往往需要额外配置，idea 本地环境想要读取lzo文件，就要使本地环境支持lzo依赖出于开发的便利，需要idea中读取到lzo压缩的数据

2022-09-26 12:29:58 927

原创大数据集群是否可以用docker

对于docker虚拟机技术是否可以搭建大数据集群的思考

2022-09-09 10:46:14 954

原创 hive中 collect 行转列用limit遇到的问题

可以看到hive 中 limit后使用collect_list 列出的内容并非是 limit 限制的内容

2022-02-18 10:26:44 867

原创 flume 概念及要点

1、Flume概述 1、flume是什么? flume是海量日志收集、聚合、传输系统 2、flume基础架构 Agent: JVM进程,启动flume采集数据的时候启动的就是agent进程 Source: 定义从哪里采集数据 Channel: Source和sink之间的缓冲区，解耦 Memory channel: 数据保存在内存 ...

2021-08-29 21:52:59 362

原创 hive 初步安装之mysql

安装mysql之前要删掉derby的数据删除生成的目录 /user[这里]

2021-08-21 23:32:34 185

guitarCC的博客