大数据实时处理--半期总结

这学期开设的课叫大数据实时处理,还是用的虚拟机和idea,是上学期配置的,只是运用了scala语言,还有spark框架。

spark 是一个分布式的计算框架,是我目前认为最火的计算框架。

如今大数据技术已经遍布生产的各个角落,其中又主要分为离线处理和实时流处理。本实战项目则是使用了实时流处理,而大数据的实时流式处理的特点:
1.数据会不断的产生,且数量巨大。
2.需要对产生额数据实时进行处理。
3.处理完的结果需要实时读写进数据库或用作其他分析。
针对以上的特点,传统的数据处理结构已经无力胜任,因而产生的大数据实时流处理的架构思想

spark,是一种"one stack to rulethem all"的大数据计算框架,期望使用一个技术栈就完美地解决大数据领域的各种计算任务。apache 官方,对 spark 的定义是:通用的大数据快速处理引擎(一“栈”式)。

Spark就是使用Scala编写的。因此为了学好spark这个框架,需要掌握scala语言。

Scala 是 Scalable Language 的简写,是一门多范式(范式/编程方式[面向对象/函数式编程])的编程语言。

说是半学期其实已经要四个月了,对于这四个月的学习,我有以下几点感受:

1.早八不容易进入状态,老是忘记连接好三个虚拟机,开启端口。

2.基础薄弱,跟上节奏需要更多的精力

3.下课基本都没放松,不是在解决问题的路上就是在创造问题的路上

4.写的博客没跟上节奏,落下了太多

5.不能说掌握了scala语言,只能说基础会了,不是每句都要问

6.永远期待新的一天

7.之前一直不太明白Hadoop和JAVA的交集在哪里,通过这次的学习知道了Hadoop是通过调用JAVA的API对数据进行相应的操作,也就是说在Hadoop的学习中对JAVA水平的要求也是比较高的。现在JAVA的水平还是比较低,所以今后也要抓紧对JAVA的学习,提高编程水平。

除了上面这些感受,还得多亏老师的讲稿是对我们开放的,可以随时查看,讲稿很长,是因为每一步都很详细,有扩展的知识,老师也会顺带提一下。可能会遇到的问题老师也会在讲稿中贴出,不是每个人问题都一样,我们会在课上找老师解决,方便我们下一节课能正常进行。专业课中最喜欢的就是这门课的老师,上课说话幽默风趣,穿插英语,还会不自觉的撒娇,简直了。(还得是内容好懂,耐心->教我们这些小笨蛋也能教好,爱了爱了)

大二下学期倒数两个月,就要开启我的大三生活,面临找工作,社会人际,感觉前路是一片迷雾,想的是现掌握的知识够不够我找到对口的工作,对口的工作需要什么样的人才,敲门砖有什么......

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值