Java开发工程师与大数据开发工程师有何区别?1

在这里插入图片描述

【此文章转自乐字节】

提起Java或大数据,很多人对此都一目了然,但对于Java大数据这样一个新鲜名词,多少有些疑惑。那Java和Java大数据学习的内容是一样的吗?两者有什么区别呢?

Java和Java大数据二者关系

Java是计算机的一门编程语言;可以用来做很多工作,大数据开发属于其中一种。

大数据属于互联网方向,就像现在建立在大数据基础上的AI方向一样,它们两不是一个同类,但是属于包含和被包含的关系;

Java可以用来做大数据工作,大数据开发或者应用不必要用Java,也可以用Python,Scala,Go语言等。

大数据属于互联网方向,就像现在建立在大数据基础上的AI方向一样,它们两不是一个同类,但是属于包含和被包含的关系;

目前最火的大数据开发平台是Hadoop,而Hadoop则是采用Java语言编写。一方面由于Hadoop的历史原因,Hadoop的项目诞生于一个Java高手;另一方面,也有Java跨平台方面的优势;基于这两个方面的原因,所以Hadoop采用了Java语言。但是也因为Hadoop使用了Java所以就出现了“Java大数据”。

Java是我们耳熟能详的编程语言,大数据更是当今科技的明星技术。而java大数据则是Java和大数据的结合产物,也可以说是Java程序员向大数据程序员的过渡阶段。

最近发现有些同学并不太了解大数据开发工程师这个职位,所以想简单介绍一下什么是大数据开发工程师,当前互联网公司的数据开发到底是什么样子的?和一般的Java或者PHP工程师在工作上有什么区别?

什么不是大数据开发?
  • 仅使用数据库(关系型mysql,sqlserver,oracle等 非关系型 mongo redis等),尽管数据量达到千万级别,亿级别不是大数据开发。
  • 从业务系统的数据库中查询数据然后产出报表不是大数据开。
  • 端上(页面,h5,手机native)埋点上报数据记录到数据库中不是大数据开发。
什么是大数据开发
1. 大数据开发需要的技能

到智联上搜了一下大数据开发工程师这个职位,随便点了几个职位,截图如下:

在这里插入图片描述

所以说,现在互联网公司所指的大数据开发用到的工具是:hadoop,hive,hbase,spark,kafka等。

2. 大数据开发做的事情
  • 精简到一个词语就是:统计
  • 精简到两类指标就是:PV和UV
  • 精简到一句话就是:统计各种指标的PV和UV

PC互联网时代,各门户网站(比如:新浪,网易,搜狐)关注的是各自网站今天被打开了几次(pv),今天有多少人(uv)访问了网站。更复杂一点的比如:

  • 页面上某个按钮或者某个连接有多少人点击了几次
  • 某个页面上的热力图(点击地方越多,图上颜色越重)

移动互联网时代,手机应用被用户打开的次数和人数也是大家关注的重点,但是除此之外还多出了许多其他非常重要的数据,由于手机屏幕的限制,信息流成为了移动时代的主流。

大门户网站非常关注自己的新闻客户端中:在信息流中曝光了多少篇文章,其中有多少篇文章被用户点击了。每篇文章阅读了长时间,因为用户点击的文章越多,使用客户端的时间越长,各公司的广告收入才越高,所以各公司想方设法推荐用户喜欢的内容。

3. 如何做这些事情

因为网站的浏览行为,手机客户端中文章的曝光或者点击这些数据非常大,基本以亿为单位起。所以传统的把统计信息放到数据库中的方式已经不能完成这项统计工作。

所以大数据是通过日志来统计这些指标。

比如:后台服务的日志(apache,tomcat,weblogic,nginx日志)

主要难点在于:
  • 日志量太大(一般大点的互联网公司,一个业务线每天的日志都有几个t,再大些的每天几十t,几百t也不奇怪),需要掌握大数据相关技术例如前面提到的hadoop,hive等。
  • 数据的及时性,从离线计算来说,一般每天零点,前一天的日志都接收完毕,开始计算前一天的数据,几点能计算完毕?要看各个公司各自的要求。
  • 数据的准确性。(这是重中之重,大数据开发的工作就是统计,统计的数据如果不准…)
  • 如果是实时计算,需要掌握实时相关技术。例如:每5分钟网站的在线人数。
  • 监控监控监控:监控任务是否失败,数据是否产出,产出的数据是否异常。
  • 容灾容灾容灾:如果任务失败如何补救。比如实时任务,由于某种原因13:00到14:00的数据没有,如何把数据补回来。
大数据开发和一般开发对比

在转做大数据开发之前,一直在用Java作业务系统:例如hr系统(考勤,薪资等),收费系统。

谈谈我个人对业务系统开发和大数据开发的理解:

业务系统:

一句话:对数据库的各种增删改查操作。

重点难点在于:

  • 对复杂业务的理解上(比如计算工资:基本工资,五险一金,全勤奖,高温补贴,报销,奖金,加班费…等等都需要计算)。
  • 线上服务的稳定,比如facebook,淘宝等网站高并发的压力下维持网站正常运行。
大数据开发
一句话:对字符串的各种算数。

重难点在于:

  • 数据的及时性。例如实时数据中,想知道 12:00~12:10这10分钟的用户数,如果这个数据在晚上20点才计算完成,那就没什么意义了。再比如,大家应该都有体验过:再手机上刷新闻的时候,你点了某一篇文章,再继续刷新闻,后面很快会出来不少和前面点击的那篇文章类似的文章,这就是根据你的点击给你及时推荐你有更大可能点的东西。
  • 数据的准确性。这个重要性不言而喻
  • 数据的稳定性和容灾。
学互联网技术不能犹豫,否则你就和高薪擦肩而过了。

注:每周福利均会更新,更多福利等你领取,更多技巧,欢迎在评论区一起交流!

+君羊前面三位606,中间三位846,后面三位127,进君羊暗号T123,领取Python ,web前端开发,Python爬虫,Python数据分析,人工智能,Java项目,Java基础等精品学习课程。带你从零基础系统性的学好Python,Java,web前端!做一名牛逼的程序员!

END
祝大家学的愉快,学的神速。
有帮助的话,各位小伙伴可以点个赞收藏支持下啦!❤️
也欢迎关煮lili,一个在变秃,但能带你变强的程序员~
今天先说这么多,我是乐字节哩哩,一个有趣的灵魂!下期见!

最后给大家推荐几个B站超详细的Java、大数据、python等自学课

从Java零基础到项目实战哦【b站BV: BV1CB4y1A7sk】

十大企业级项目自学课【b站:BV14K411F7HJ】

超棒的前后端分离项目【b站:BV1zf4y1p7wC】

大数据全套完整版【b站:BV1aK4y197TP】

python小白入门到精通完整版【b站:BV1Sp4y1W77E】

将bv号,复制去b站即可

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值