数据分析
文章平均质量分 70
铁拳虎
这个作者很懒,什么都没留下…
展开
-
零基础怎么系统学习大数据?
大数据技术是指从各种各样类型的巨量数据中,快速获得有价值信息的技术。解决大数据问题的核心是大数据技术。零基础怎么系统学习大数据?首先我们先了解一下什么是大数据。 "大数据"是一个体量特别大,数据类别特别大的数据集,并且这样的数据集无法用传统数据库工具对其内容进行抓取、管理和处理。大数据工程师需要学习哪些知识?一、从入门到进阶,大致罗列了8大学习阶段:很多初学者,对大数据的概念都...原创 2018-10-31 16:40:07 · 667 阅读 · 0 评论 -
大数据需要学习哪些技术?
大数据是对海量数据进行存储、计算、统计、分析处理的一系列处理手段,处理的数据量通常是TB级,甚至是PB或EB级的数据,这是传统数据处理手段所无法完成的,其涉及的技术有分布式计算、高并发处理、高可用处理、集群、实时性计算等,汇集了当前IT领域热门流行的IT技术。想要学好大数据需掌握以下技术: 在这里还是要推荐下我自己建的大数据学习交流群:199427210,群里都是学大数据开发的,如...原创 2018-10-30 17:13:13 · 42327 阅读 · 15 评论 -
sparkSQL的整体实现框架
是让那些初次接触sparkSQL框架的童鞋们,希望他们对sparkSQL整体框架有一个大致的了解,降低他们进入spark世界的门槛,避免他们在刚刚接触sparkSQL时,不知所措,不知道该学习什么,该怎么看。这也是自己工作的一个总结,以便以后可以回头查看。后续会对sparkSQL进行一系列详细的介绍。慢慢来吧~~~1、sql语句的模块解析 当我们写一个查询语句时,一般包含三个部分,se...原创 2018-11-03 16:38:06 · 309 阅读 · 0 评论 -
什么是大数据?如何成为大数据工程师?
这几年来大数据非常的热门,到处都有大数据分析的演讲。 演讲内容通常是宣传各种大数据分析成功的案例。 但实际上大数据该怎么做呢? 大部份的讨论似乎都仅止于怎么搜集大量的数据, 然后用个工具(hadoop/spark)后就会马上变出商机和钱来。笔者是工程师而非技术或平台传教者,我想用务实一点的方式来看待大数据。 大数据技术最重要的核心在于如何设计可以高性能处理大量数据的程式 (highly...原创 2018-11-01 22:30:38 · 274 阅读 · 0 评论 -
小白学习大数据掌握这几个方法可轻松入门
有很多学习大数据的朋友,在初期学习时,通常会对如何学习而感到迷茫。我经常看到关于如何入门、如何规划学习大数据、大数据的学习流程是什么的一些问题。今天我就粗浅的总结几点学习大数据方法。一、兴趣建立兴趣是可以让一个人持续关注一个事物的核心动力,那么兴趣的培养就非常重要了。如果你把写程序单纯作为赚钱手段,久而久之疲劳感会越来越强,会给今后的工作和生活带来很大的压力。那么如何建立起对大数据的兴...原创 2018-11-06 14:15:52 · 254 阅读 · 0 评论 -
做为一名大数据新手,如何成为大数据工程师?附上学习路线
这几年来大数据非常的热门,到处都有大数据分析的演讲。 演讲内容通常是宣传各种大数据分析成功的案例。 但实际上大数据该怎么做呢? 大部份的讨论似乎都仅止于怎么搜集大量的数据, 然后用个工具(hadoop/spark)后就会马上变出商机和钱来。 大数据技术最重要的核心在于如何设计可以高性能处理大量数据的程式 (highly scalable programs.)目前大数据相关工作可以粗分几...原创 2018-11-09 13:25:26 · 16128 阅读 · 4 评论 -
想学习大数据?这才是完整的大数据学习体系
大数据干货走起,闲话不多说,以下就是小编整理的大数据学习思路第一阶段:linux系统本阶段为大数据学习入门基础课程,帮大家进入大数据领取打好Linux基础,以便更好的学习Hadoop、habse、NoSQL、saprk、storm等众多技术要点。另:目前企业中无疑例外是使用Linux来搭建或部署项目的第二阶段:大型网站高并发处理本阶段的学习是为了让大家能够了解大数据的源...原创 2018-11-04 12:44:26 · 774 阅读 · 0 评论 -
学习大数据课程 spark 基于内存的分布式计算框架(二)RDD 编程基础使用
学习大数据课程 spark 基于内存的分布式计算框架(二)RDD 编程基础使用 1.常用的转换假设rdd的元素是: {1,2,2,3} 很多初学者,对大数据的概念都是模糊不清的,大数据是什么,能做什么,学的时候,该按照什么线路去学习,学完往哪方面发展,想深入了解,想学习的同学欢迎加入大数据学习qq群:199427210,有大量干货(零基础以及进阶的经典实战)分享给大家,并且...原创 2018-11-02 21:02:07 · 794 阅读 · 0 评论 -
以Hadoop入门大数据
以Hadoop入门大数据一、Hadoop简介1.什么是Hadoop-Apache™ Hadoop® project 生产出的用于高可靠、可扩展、分布式计算的开源软件,它允许通过集群的方式使用简单的编程模型分布式处理大数据,它可以从单一的服务器扩展到成千上万的机器,每一台机器都能提供本地计算和存储。Hadoop认为集群中节点故障为常态,它可以自动检测和处理故障节点,所以它不依赖硬件...原创 2018-11-07 22:10:57 · 241 阅读 · 0 评论 -
常用的几种大数据架构剖析
数据分析工作虽然隐藏在业务系统背后,但是具有非常重要的作用,数据分析的结果对决策、业务发展有着举足轻重的作用。随着大数据技术的发展,数据挖掘、数据探索等专有名词曝光度越来越高,但是在类似于Hadoop系列的大数据分析系统大行其道之前,数据分析工作已经经历了长足的发展,尤其是以BI系统为主的数据分析,已经有了非常成熟和稳定的技术方案和生态系统,对于BI系统来说,大概的架构图如下:可以看到在B...原创 2018-11-11 10:09:18 · 2027 阅读 · 0 评论 -
什么是大数据?如何成为大数据开发工程师技术大牛?
其实大数据并不是一种概念,而是一种方法论。简单来说,就是通过分析和挖掘全量的非抽样的数据辅助决策。大数据可以实现的应用可以概括为两个方向,一个是精准化定制,第二个是预测。比如像通过搜索引擎搜索同样的内容,每个人的结果却是大不相同的。再比如精准营销、百度的推广、淘宝的喜欢推荐,或者你到了一个地方,自动给你推荐周边的消费设施等等。 目前市场对大数据相关人才的需求与日俱增,岗位的增多,也...原创 2018-11-13 16:41:41 · 1302 阅读 · 0 评论 -
终于有人把云计算、大数据和人工智能讲明白了!
今天跟大家讲讲云计算、大数据和人工智能。这三个词现在非常火,并且它们之间好像互相有关系。 一般谈云计算的时候会提到大数据、谈人工智能的时候会提大数据、谈人工智能的时候会提云计算……感觉三者之间相辅相成又不可分割。但如果是非技术的人员,就可能比较难理解这三者之间的相互关系,所以有必要解释一下。云计算最初的目标我们首先来说云计算。云计算最初的目标是对资源的管理,管理的主要是计算资源...转载 2018-11-08 12:20:35 · 3109 阅读 · 0 评论 -
自学大数据需要从哪里入手 收藏了一份详细的学习路线图
近期,经常听到这样一句特别豪气的话"我家里有矿"!对于数据而言,没有大数据技术的数据一无是处,但经过大数据技术处理的数据,就是金矿,价值连城!面临能将"矿"玩弄于股掌之间的大数据技术,谁能坐怀不乱?谁又能忍心放弃这个难得的机遇呢?那么问题来了,该如何学习大数据技术呢?学习是一项很好的技能,但也需要循序渐进!学习大数据的头一步:打好基础,比高逼格的大数据技术更重要!而基础知识就是:编程语言和...原创 2018-11-12 15:32:08 · 1462 阅读 · 0 评论 -
hadoop程序员用自己5年的实战经验告诉你大数据是这样搭建环境
Hadoop由GNU / Linux平台及其版本支持。因此,我们必须安装一个Linux操作系统来设置Hadoop环境。如果您有除Linux以外的操作系统,您可以在其中安装Virtualbox软件,并在Virtualbox内部安装Linux。 安装前设置在将Hadoop安装到Linux环境之前,我们需要使用ssh(Secure Shell)来设置Linux。按照以下步骤设置Lin...原创 2018-11-14 22:46:59 · 743 阅读 · 0 评论 -
新手如何进入大数据领域,学习路线是什么?
大数据不是某个专业或一门编程语言,实际上它是一系列技术的组合运用。有人通过下方的等式给出了大数据的定义。大数据 = 编程技巧 + 数据结构和算法 + 分析能力 + 数据库技能 + 数学 + 机器学习 + NLP + OS + 密码学 + 并行编程虽然这个等式看起来很长,需要学习的东西很多,但付出和汇报是成正比的,至少和薪资是成正比的。既然要学的知识很多,那么一个正确的学习顺序就非...原创 2018-11-21 15:05:23 · 2671 阅读 · 1 评论 -
大数据技术开发最火的核心技术-Kafka
大数据时代来临,如果你还不知道Kafka那你就真的out了!据统计,有三分之一的世界财富500强企业正在使用Kafka,包括所有TOP10旅游公司,7家TOP10银行,8家TOP10保险公司,9家TOP10电信公司等等。 LinkedIn,Microsoft和Netflix每天都用Kafka处理万亿级的信息。Kafka主要应用于实时信息流的大数据收集或者实时分析(或者两者...原创 2018-11-15 12:14:04 · 238 阅读 · 0 评论 -
5个常用的大数据可视化分析工具,你知道吗?
大数据及移动互联网时代,每一个使用移动终端的人无时无刻不在生产数据,而作为互联网服务提供的产品来说,也在持续不断的积累数据。数据如同人工智能一样,往往能表现出更为客观、理性的一面,数据可以让人更加直观、清晰的认识世界,数据也可以指导人更加理智的做出决策。而在大数据时代的今天,最有价值的商品则是数据。那么今天小编在这里给大家推荐一些常用于数据分析的必备神器。 1.Tableau...原创 2018-11-19 13:08:18 · 38508 阅读 · 0 评论 -
大数据资源整理
大数据最近几年很火,如果你去问读研的小伙伴,搞计算机的,我相信不是搞数据处理就是搞机器学习的,这都属于大数据的范畴。虽然大数据很火,但是网上的资源却比较少,主要是很零碎,不成体系。当然,想要搞大数据,数学知识诸如:高等数学,线性代数,概率论,统计学……是必不可少的,我这里就不介绍这些相关资源了;当然也不整理算法啦、数据结构啦、具体的语言学习啦这些基础知识;那肯定更不会整理大数据相关的...原创 2018-11-23 20:35:41 · 295 阅读 · 0 评论 -
从业大数据方向,需要掌握哪些技能,具体学习路线是什么?
一、大数据相关工作介绍大数据方向的工作目前主要分为三个主要方向:1. 大数据工程师2. 数据分析师3. 大数据科学家4. 其他(数据挖掘等)二、大数据工程师的技能要求附上大数据工程师技能图: 本人对于大数据学习创建了一个小小的学习圈子,为各位提供了一个平台,大家一起来讨论学习大数据。欢迎各位到来大数据学习群:868847735 一起讨论视频分享学习。大数据是...原创 2018-11-22 12:02:16 · 2610 阅读 · 0 评论 -
大数据分析学习的详细解读
以大数据分析师为目标,从数据分析基础、JAVA语言入门和linux操作系统入门知识学起,系统介绍Hadoop、HDFS、MapReduce和Hbase等理论知识和hadoop的生态环境。 一、大数据分析的五个基本方面1,可视化分析大数据分析的使用者有大数据分析专家,同时还有普通用户,但是他们二者对于大数据分析最基本的要求就是可视化分析,因为可视化分析能够直观的呈现大数据特点...原创 2018-11-18 14:13:03 · 3573 阅读 · 0 评论 -
想转行大数据,如何开始学习 Hadoop?
想转行大数据,如何开始学习 Hadoop? 学习大数据首先要了解大数据的学习路线,首先搞清楚先学什么,再学什么,大的学习框架知道了,剩下的就是一步一个脚印踏踏实实从最基础的开始学起。这里给大家普及一下学习路线:hadoop生态圈——Strom——Spark——算法。所以学习hadoop是第一步,在这里声明一下,在学习hadoop之前需要有java基础,因为hadoop底层全是用j...原创 2018-11-25 21:54:23 · 292 阅读 · 0 评论 -
你真的明白什么是大数据吗?
大数据这个名词并不是啥新名词,如果对于IT比较熟悉的兄弟,估计听这个名词有6-7年的时间了,对这个有一定的了解,但是对于那些不熟悉IT的朋友来说,这个名词虽然在互联网和各媒体中听到见到很多,估计脑子仍然是一头雾水,到底什么是大数据? 本人对于大数据学习创建了一个小小的学习圈子,为各位提供了一个平台,大家一起来讨论学习大数据。欢迎各位到来大数据学习群:868847735 一起讨论视频分享...原创 2018-12-02 14:35:55 · 634 阅读 · 0 评论 -
我是学Java的,想尝试学习大数据和数据挖掘,该怎么规划学习路线?
个人是从Java后端开发,经过3个月的业余自学成功转型大数据工程师。背景介绍完毕,开始正式一本正经回答问题:本回答目录:一.大数据方向工作介绍二.大数据工程师的技能要求三.大数据学习路径四.学习资源推荐(书籍、博客、网站) 一.大数据方向工作介绍大数据方向的工作目前分为三个主要方向:01.大数据工程师02.数据分析师03.大数据科学家04.其他(数据挖掘本质...原创 2018-11-26 17:30:29 · 465 阅读 · 0 评论 -
月薪35-60K的大数据开发工程师们,他们背后是如何学习的
大数据开发相关职位的薪资,主要有hadoop工程师,数据挖掘工程师、大数据算法工程师等,从平均薪资来看,目前大数据相关岗位的月薪均在2万以上,随着项目经验的增长工资会越来越高。那么对于新手来说,应该如何开始学习,才能够早日的实现月薪2万多的目标。就小编了解的来说,新手一般需要一年以上的时间才能够达到2万以上的薪资,目前很多人选择参加培训然后快速进入工作岗位,积累经验,客观的讲在目前的情况下,不...原创 2018-11-30 16:41:21 · 494 阅读 · 0 评论 -
云计算、大数据、人工智能的关系
对一个大数据公司,积累了大量的数据,也会使用一些人工智能的算法提供一些服务。对于一个人工智能公司,也不可能没有大数据平台支撑。所以云计算,大数据,人工智能就这样整合起来,完成了相遇,相识,相知。 一、云计算最初是实现资源管理的灵活性我们首先来说云计算,云计算最初的目标是对资源的管理,管理的主要是计算,存储,网络资源。本人对于大数据学习创建了一个小小的学习圈子,为各位提供了...转载 2018-11-27 23:03:28 · 525 阅读 · 0 评论 -
大数据需要学什么
学习要根据自身情况来定,如果你是零基础,那就必须先从基础Java开始学起(大数据支持很多开发语言,但企业用的最多的还是JAVA),接下来学习数据结构、Linux系统操作、关系型数据库,夯实基础之后,再进入大数据的学习,具体可以按照如下体系: 第一阶段CORE JAVA (加**的需重点熟练掌握,其他掌握)Java基础**数据类型,运算符、循环,算法,顺序结构程序设计,程...原创 2018-12-01 12:12:03 · 1109 阅读 · 0 评论 -
[看图说话] 基于Spark UI性能优化与调试——初级篇
Spark有几种部署的模式,单机版、集群版等等,平时单机版在数据量不大的时候可以跟传统的java程序一样进行断电调试、但是在集群上调试就比较麻烦了...远程断点不太方便,只能通过Log的形式进行数据分析,利用spark ui做性能调整和优化。那么本篇就介绍下如何利用Ui做性能分析,因为本人的经验也不是很丰富,所以只能作为一个入门的介绍。大体上会按照下面的思路进行讲解:怎么访问S...原创 2018-12-06 17:21:07 · 146 阅读 · 0 评论 -
大数据初学者应该怎样学?
学习大数据的话,可以给你一个大纲,入门可以参考。 很多初学者,对大数据的概念都是模糊不清的,大数据是什么,能做什么,学的时候,该按照什么线路去学习,学完往哪方面发展,想深入了解,想学习的同学欢迎加入大数据学习qq群:199427210,有大量干货(零基础以及进阶的经典实战)分享给大家,并且有清华大学毕业的资深大数据讲师给大家免费授课,给大家分享目前国内最完整的大数据高端实战实用学习流程...原创 2018-12-14 15:25:36 · 230 阅读 · 0 评论 -
大数据必须掌握的三个基本算法
一全排序Hadoop自带的Partitioner的实现有两种,一种为HashPartitioner, 默认的分区方式,计算公式 hash(key)%reducernum,另一种为TotalOrderPartitioner, 为排序作业创建分区,分区中数据的范围需要通过分区文件来指定。 很多初学者,对大数据的概念都是模糊不清的,大数据是什么,能做什么,学的时候,该按照什么线路去学习,...原创 2018-12-09 21:32:21 · 17408 阅读 · 0 评论 -
如何成为一个大数据开发工程师?
大数据工程师有多种解释,一种是用大数据的,就是data scientist这种,一种是开发大数据平台的,就是平台开发工程师,比如写hadoop,hive的某个组件的工程师。2.如果是走应用这个路线,需要的技能包括:sql,java,mapreduce job的编写,一些比较简单的脚本编写,再加上一些数据分析领域的东西,比如统计,机器学习等等。3.如果是走底层开发这个路线的,需要的技能基本上...原创 2018-12-15 16:37:16 · 341 阅读 · 0 评论 -
大数据学习基础分享总结
1.linuxshell指令学习我是从私房菜开始看的,而且只看了shell指令相关的 互联网科技发展蓬勃兴起,人工智能时代来临,抓住下一个风口。为帮助那些往想互联网方向转行想学习,却因为时间不够,资源不足而放弃的人。我自己整理的一份最新的大数据进阶资料和高级开发教程,大数据学习群:868847735 欢迎进阶中和进想深入大数据的小伙伴加入。 2.hadoop h...原创 2018-12-26 22:13:21 · 1222 阅读 · 0 评论 -
大数据开发:实时数据平台和流计算
大数据开发 1、实时数据平台整体架构 实时数据平台的支撑技术主要包含四个方面:实时数据采集(如Flume),消息中间件(如Kafka), 流计算框架(如Storm, Spark, Flink和Beam),以及数据实时存储(如列族存储的HBase) 实时数据平台最为核心的技术是流计算。 2、流计算 流计算的典型特征: 1、无...原创 2018-12-17 19:56:20 · 872 阅读 · 0 评论 -
学习云计算与大数据就业前景好吗?
越来越多的人认识接触云计算和大数据,但是真正的对于这两个的认识和理解确是少之又少,很多人都想问云计算与大数据前景好吗?现在学习就业怎么样?如果你想进入云计算和大数据,那么先了解一下什么是云计算和大数据吧,只有详细的了解之后,才有可能更好的去掌握和学习它。云计算:云计算是基于互联网的相关服务的增加、使用和交付模式,通常涉及通过互联网来提供动态易扩展且经常是虚拟化的资源。云是网络、互联网的...原创 2018-12-28 20:59:11 · 15988 阅读 · 2 评论 -
大数据工程师的必备技能
大数据工程师的必备技能 一、数据可视化 R不仅是编程语言,同时也R具有强大的统计计算功能和便捷的数据可视化系统。在此,推荐大家看一本书,这本书叫做《R数据可视化手册》。《R数据可视化手册》重点讲解R的绘图系统,指导读者通过绘图系统实现数据可视化。书中提供了快速绘制高质量图形的150多种技巧,每个技巧用来解决一个特定的绘图需求。 大数据是未来的发展方向,正在挑战我们的分析能力及对世界的...原创 2018-12-23 21:39:38 · 816 阅读 · 0 评论 -
作为刚入职的小白,怎么才能学好大数据 ?
大数据学习方向 一、大数据运维之Linux基础打好Linux基础,以便更好地学习Hadoop,hbase,NoSQL,Spark,Storm,docker,openstack等。因为企业中的项目基本上都是使用Linux环境下搭建或部署的。 1)Linux系统概述 2)系统安装及相关配置 3)Linux网络基础 4)OpenSSH实现网络安全连接 ...转载 2018-12-18 18:20:52 · 777 阅读 · 0 评论 -
学习大数据需要掌握的基础是什么?是Java!
近几年,很多人都听到过一个名词“大数据”也有一部分人选择学习了解大数据,那么大数据到底是什么?学习大数据需要有Java基础吗?接下来,小编带你详细了解一下。如果要学习大数据,不管你是零基础,还是有一定的基础,都应该知道在学大数据之前一定要懂至少一种计算机编程语言,因为大数据的开发离不开编程语言,不仅要懂,还要精通! 大数据是未来的发展方向,正在挑战我们的分析能力及对世界的认知方式,...原创 2018-12-24 14:05:46 · 880 阅读 · 0 评论 -
5个学习大数据的正确姿势
数据科学这个新领域发展迅速的同时也有着较大的人才缺口,还有其可观的薪资吸引了无数人。小编分享学习大数据的5个正确姿势: 一、学习动机 数据科学是一个广泛而模糊的领域,这使得它很难学习。没有动力,你最终会中途停止对自己失去信心。所以,你需要动力去激励自己,即使是在半夜公式已经开始变的模糊,你还是想探究关于神经网络的意义。你需要些动力来让你发现统计、线性代数和神经网络之间的...原创 2018-12-29 16:26:13 · 571 阅读 · 0 评论 -
震惊,这个大数据技术全球独此一家,怎么学习大数据?
小白如何学习大数据技术?大数据怎么入门?怎么做大数据分析?数据科学需要学习那些技术?大数据的应用前景等等问题,已成为热门大数据领域热门问题,以下是对新手如何学习大数据技术问题的解答~大数据开发学习可以按照以下内容进行学习 互联网科技发展蓬勃兴起,人工智能时代来临,抓住下一个风口。为帮助那些往想互联网方向转行想学习,却因为时间不够,资源不足而放弃的人。我自己整理的一份最新的大数据进阶资料...原创 2019-01-10 15:53:43 · 263 阅读 · 0 评论 -
大数据学习有哪些难度
大数据作为当下谈论的首要话题,无论行业只要和大数据牵上话题,瞬间提高了档次。那么大数据作为炙热的项目,大数据学习难度大吗?大数据应该怎么学习呢?下面就带着大家一起来看一看。零基础学习大数据一般有以下几步:1.了解大数据理论2.计算机编程语言学习3.大数据相关课程学习4.实战项目如果你想要学好大数据最好加入一个组织,这样大家学习的话就比较方便,还能够共同交流和分享资料,大...原创 2019-01-05 17:30:35 · 2824 阅读 · 0 评论 -
最火的软件开发工程师薪资调查,大数据位居榜首!
如今软件开发工程师越来越吃香,小姑娘找对象指明就要找程序员。看来学习当程序员不仅可以拿到高薪资,还容易抱得美人归啊~程序员上班,不仅可以喝着咖啡,听着音乐敲着代码?还可以拿着比别的行业高好几倍的工资,小编想想都是泪啊!互联网科技发展蓬勃兴起,人工智能时代来临,抓住下一个风口。为帮助那些往想互联网方向转行想学习,却因为时间不够,资源不足而放弃的人。我自己整理的一份最新的大数据进阶资料和高...原创 2019-01-06 18:57:09 · 3370 阅读 · 1 评论