大数据实时处理--半期总结

摸摸小油头.

已于 2023-05-11 09:24:09 修改

阅读量185

点赞数

分类专栏：学期总结文章标签： spark 大数据 java

于 2023-05-11 09:22:58 首次发布

本文链接：https://blog.csdn.net/weixin_64272885/article/details/130613956

版权

学期总结专栏收录该内容

3 篇文章 0 订阅

订阅专栏

这学期开设的课叫大数据实时处理，还是用的虚拟机和idea，是上学期配置的，只是运用了scala语言，还有spark框架。

spark 是一个分布式的计算框架，是我目前认为最火的计算框架。

如今大数据技术已经遍布生产的各个角落，其中又主要分为离线处理和实时流处理。本实战项目则是使用了实时流处理，而大数据的实时流式处理的特点：
1.数据会不断的产生，且数量巨大。
2.需要对产生额数据实时进行处理。
3.处理完的结果需要实时读写进数据库或用作其他分析。
针对以上的特点，传统的数据处理结构已经无力胜任，因而产生的大数据实时流处理的架构思想

spark，是一种"one stack to rulethem all"的大数据计算框架,期望使用一个技术栈就完美地解决大数据领域的各种计算任务。apache 官方,对 spark 的定义是:通用的大数据快速处理引擎（一“栈”式）。

Spark就是使用Scala编写的。因此为了学好spark这个框架，需要掌握scala语言。

Scala 是 Scalable Language 的简写，是一门多范式(范式/编程方式[面向对象/函数式编程])的编程语言。

说是半学期其实已经要四个月了，对于这四个月的学习，我有以下几点感受：

1.早八不容易进入状态，老是忘记连接好三个虚拟机，开启端口。

2.基础薄弱，跟上节奏需要更多的精力

3.下课基本都没放松，不是在解决问题的路上就是在创造问题的路上

4.写的博客没跟上节奏，落下了太多

5.不能说掌握了scala语言，只能说基础会了，不是每句都要问

6.永远期待新的一天

7.之前一直不太明白Hadoop和JAVA的交集在哪里，通过这次的学习知道了Hadoop是通过调用JAVA的API对数据进行相应的操作，也就是说在Hadoop的学习中对JAVA水平的要求也是比较高的。现在JAVA的水平还是比较低，所以今后也要抓紧对JAVA的学习，提高编程水平。

除了上面这些感受，还得多亏老师的讲稿是对我们开放的，可以随时查看，讲稿很长，是因为每一步都很详细，有扩展的知识，老师也会顺带提一下。可能会遇到的问题老师也会在讲稿中贴出，不是每个人问题都一样，我们会在课上找老师解决，方便我们下一节课能正常进行。专业课中最喜欢的就是这门课的老师，上课说话幽默风趣，穿插英语，还会不自觉的撒娇，简直了。（还得是内容好懂，耐心->教我们这些小笨蛋也能教好，爱了爱了）

大二下学期倒数两个月，就要开启我的大三生活，面临找工作，社会人际，感觉前路是一片迷雾，想的是现掌握的知识够不够我找到对口的工作，对口的工作需要什么样的人才，敲门砖有什么......

摸摸小油头.

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
大数据实时处理--半期总结

7.之前一直不太明白Hadoop和JAVA的交集在哪里，通过这次的学习知道了Hadoop是通过调用JAVA的API对数据进行相应的操作，也就是说在Hadoop的学习中对JAVA水平的要求也是比较高的。大二下学期倒数两个月，就要开启我的大三生活，面临找工作，社会人际，感觉前路是一片迷雾，想的是现掌握的知识够不够我找到对口的工作，对口的工作需要什么样的人才，敲门砖有什么......这学期开设的课叫大数据实时处理，还是用的虚拟机和idea，是上学期配置的，只是运用了scala语言，还有spark框架。
复制链接

扫一扫

专栏目录