自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(113)
  • 收藏
  • 关注

转载 关于NoSQL数据库的分类以及优缺点!

传统的关系系数据库已经无法应对数据日益庞大的企业,特别是互联网快速发展行业,因此现在企业IT架构中首先考虑使用NoSQL数据库。那什么是NoSQL数据库呢?今天大圣众包(www.dashengzb.cn)小编看到一篇来自化学数据联盟的文章,关于NoSQL数据库的分类以及各自的优缺点。  NoSQL顾名思义就是Not-OnlySQL,它可以作为关系型数据库的良好补充。在TechTar

2016-12-06 15:24:09 8011

原创 ApacheBeam:大数据处理的一大神器!

你知道被认为继MapReduce、GFS、BigQuery等之后,Google在大数据处理领域对开源社区的又一大贡献是哪个项目吗?答案是ApacheBeam。事实上,“Beam”这个项目名称已经很清楚地表明了它的设计初衷——统一批处理(Batch)模式和数据流(Stream)处理模式的标准。今天,请跟随大圣众包威客平台的脚步,一起了解ApacheBeam到底有多炫!  一、Apac

2016-12-05 10:08:32 17441

转载 干货:用R语言进行数据提取的方法!

数据提取是数据分析当中重要的一环,也是需要数据分析师耐心细心地做好。我们大圣众包(www.dashengzb.cn)小编今天就和大家分享蓝鲸的文章,如何通过R语言对数据进行提取分析,达到所需。  读取并创建数据表  首先第一步是读取数据,并创建名称为loandata的数据表。后面我们将从这个表中进行数据提取。  将数据表中的用户ID列设置为索引列,下

2016-12-01 14:31:42 199827 3

转载 干货:分析学中常用的3种分析方法!

自互联网普及以来,随着应用开发的深入,人类对网络认知越来越深,我们不只是简单打开浏览网页,而是各种操作,不定时打开、浏览不同的信息。因此,分析用户的行为也变得越来越复杂,越来越重要。但对于很多人来说,数据分析并不是简单易懂,所以今天大圣众包(www.dashengzb.cn)小编就介绍通用的分析学方法,主要从研究、测量和分析三方面入手,可以让你更直接明了。  研究  尽管基

2016-12-01 11:00:13 995

转载 15个常用的人工智能项目应用工具!

人工智能是科技研究中最热门的方向之一。像IBM、谷歌、微软、Facebook和亚马逊等公司都在研发上投入大量的资金、或者收购那些在机器学习、神经网络、自然语言和图像处理等领域取得了进展的初创公司。考虑到人们对此感兴趣的程度,我们将不会惊讶于斯坦福的专家在人工智能报告中得出的结论:“越来越强大的人工智能应用,可能会对我们的社会和经济产生深远的积极影响,这将出现在从现在到2030年的时间段里。”

2016-11-30 10:33:38 10479

转载 Oracle常见的等待事件说明(上)

Oracle数据库系统可移植性好、使用方便、功能强,适用于各类大、中、小、微机环境,因此,它广受大数据圈相关人士的青睐。但是,在使用过程中,偶尔会遇到一些等待事件,这是为什么呢?大圣众包威客平台为你一一道来。  1、Buffer busy waits  从本质上讲,这个等待事件的产生仅说明了一个会话在等待一个Buffer(数据块),但是导致这个现象的原因却有很多种。常见的两

2016-11-29 17:20:19 4404

原创 深度学习的几个实际小应用!

深度学习,机器学习这些名词大家都有一定了解。深度学习类似于我们的大脑计算,可以高效率地处理执行任务。此外,需要重视的一点是,深度学习系统与传统的符号计算平台非常不同,正如人类与计算机的计算方式不同一样,深度学习也是如此。下面跟我们大圣众包小编一起了解深度学习!  Depth概念:depth:the length of the longest path from an input to an

2016-11-29 10:00:19 5669 1

原创 聊聊数据可视化的那些事及常用工具!

数据分析报告中常常看到各种精致漂亮的图形、表格,不仅可以直接反映给读者,而且可以让数据更形象化,降低读取数据门槛等!因此,数据可视化是数据分析当中的重要一环。下面我们大圣众包(www.dashengzb.cn)和大家一起聊聊数据可视化。  数据可视化的原理  数据可视化可以针对复杂或大规模的数据,通过计算机图形、图像、人机交互等技术,将模拟的数据转化成图形、动画、视频等形式

2016-11-28 16:14:35 747

原创 程序员跳槽:该选择互联网公司还是软件公司?

程序员跳槽常常会有一个疑问,我到底该进软件公司还是互联网公司,谁比谁高一点点?大圣众包小编就帮你找找答案,根据众网友的体验反馈将这两种公司的工作差异对比给大家看看。一、软件公司与互联网公司的典型企业有哪些,程序员们分别在哪儿上班(聚集)?1.软件公司程序员在哪些公司工作?很多人说到软件公司就是IBM、Cisco之流,其实和VC不是只有红杉、IDG一样,软件公司也是多种多样,

2016-11-25 11:12:52 7072 1

转载 程序员:你知道自己的编程水平吗?

现代心理学上一直试图通过观察一个人能够在这个冰山上打多深的孔来分析一个人能够在多大程度上掌握一种技能,我们不妨用这种方式来描述一下编程能力的4个阶段。一、无意识,无能力约翰是一个年轻的网站开发者。他以前是一个法律科的学生,但是他认为他的钱途不在这方面,所以他眼睛一转,做了转行的决定。他曾经帮他的朋友修过计算机,而且很成功,所以他认为这方面应该都很容易。他很快找的了一些能够让他学习这

2016-11-24 17:38:31 999

原创 数据分析常用的Excel函数都在这!

excel是我们工作中经常使用的一种工具,对于数据分析的朋友来说,这也是处理数据最最基础的工具,然并不是每个人都掌握得很好,玩得很溜哦,主要是excel功能强大,我们平时处理的时候很多函数功能根本不清楚怎么用。今天我们大圣众包小编根据平时工作需要及以往遇到的问题给大家总结些EXCEL中的函数。  1、先说说统计函数吧:  large,small,max,min,median

2016-11-23 18:08:54 15192

原创 解密:Apache Hive 2.1性能提升26倍!

日前,ApacheHive2.1极速登场!携着内存计算,其性能提高了约26倍。Hive计算性能得到如此大的提升,是得益于什么呢?Hive能够影响目前SQL On Hadoop的竞争局面的原因又是什么呢?大圣众包威客平台为你揭秘!  大数据时代,处理数据信息的速度越快,兼容性越高,性能越优秀,产品的竞争力才越大。而让ApacheHive2.1版本拥有以上特性的幕后功臣,分别为以下6个

2016-11-23 10:43:09 4440

转载 大数据下的关联规则,你知多少?

作为产品推荐中最常用的算法之一,你对关联规则知道多少呢?本文从概念和基本指标说起,向你介绍一些指标应用的方法。  关联规则是产品推荐中最常用的算法之一,简单地说,就是通过客户的历史购买信息,挖掘出客户在所有产品间按照某种顺序进行选择的可能性。然而,关联规则中的常用度量指标并不唯一,三四个指标相互联系,如何进行合理的排列组合、找出值得向客户推荐的产品呢?我们将从简化的实际场景跟大家探讨一下究

2016-11-18 17:40:46 4738

转载 常用的编程语言的30个深度学习库!

AlphaGo击败了围棋高手李世石后,令本来就热度不减的深度学习更是火了一把。随着深度学习需求的大大增加,IT人对深度学习库的需求也随之而增加起来。今天,就由大圣众包威客平台为你介绍包括Python、Java、Haskell等在内的一系列编程语言的深度学习库。  一、Python  Blocks是一种帮助你在Theano之上建立神经网络模型的框架。  Caffe是一

2016-11-18 10:44:27 4913

转载 数据分析师进阶就在这两方面入手!

作为数据分析师,如何提升分析能力,更好运用数据,发挥极致是我们的追求,但数据分析能力的提升更应该落到实处,从细节多方面进行。今天,大圣众包小编就分享一篇来自数据分析不是个事儿的文章吧,看看他是从哪几个方面去提升的!  业务篇  1.业务为核心,数据为王  了解整个产业链的结构  制定好业务的发展规划  了解衡量的核心指标  有了数据必须和业务

2016-11-17 16:24:28 734

转载 干货:经典的大数据问题实例合集!

大数据几乎是新兴行业当中绕不开的话题了,当真正接触或从事大数据以后,应该以什么思路去把这个不容易啃的硬骨头解决掉呢?跟随大圣众包威客平台的脚步一探究竟吧!  一、解决大数据问题的主要思路  不同的人,对大数据也有着不同的理解,从实际意义上看,大数据可以指种类多、流量大、容量大、价值高、处理和分析速度快的真实数据汇聚的产物。通常应用于存储空间、提高效率等问题上。而解决大数据问

2016-11-17 10:48:23 731

转载 7条小建议,助你更好使用大数据!

大数据的发展可谓迅速,各个公司企业都十分看重大数据的价值,即使很多地方还未能挖掘,但都时时跟进,生怕错过机遇。不过,还是有不少企业走在前头,利用大数据发挥效益,提高收益。现在我们大圣众包小编根据国外网络资源,跟大家分享7个大数据建议!  1、从长期来考虑  每年,供应商都在大数据使用方面不断提高。关系与在线交易系统(OLTP)会越来越高效、越来越智能,无论是在内部还是云中运

2016-11-16 16:16:16 635

原创 从菜鸟到高手,R语言书单都在这!

随着大数据的兴起,以及对便捷优秀的语言工具的渴求,人们对学习、掌握R语言的需求越来越大。然而,目前大部分的高校都没有开设R语言的相关课程,导致很多人不知道从何下手。大圣众包威客平台将在本文为你推荐从入门到应用的R语言相关书籍,赶紧收藏起来吧!  一、理论方面  1.初级入门  以入门来说,官方小册子《AnIntroductiontoR》便是踏进大数据分析的必备。《R4Beg

2016-11-16 10:31:19 18353

转载 初学者该如何选择编程语言呢?

互联网大热,随之对技术、程序员的需求也是很大,因此,很多大学生或想转行从事计算机编程工作,但市场上编程语言众多,我们该选择哪种语言呢?今天我们大圣众包小编根据网络资源从多个角度分析该选择哪个语言!  1.什么决定流行指数?  那么,哪种语言最流行?这个问题回答起来不如你想象的那么轻松。关键是要确定什么决定流行指数。  这是个极其开放性的问题,以至于维基百科有一篇文章

2016-11-15 17:03:46 3896

转载 人工智能真的会取代人类劳动吗?

专家们提出警告,机器代替人类劳动或将使人类成为多余。他们担心我们发现了这一强大力量却还不明白如何正确运用。有人担忧人工智能进步可消灭数以百万计就业的人士,对人类造成“终结者”式的威胁。不过这些担忧其实是两百年前机械化和蒸汽机时代的老生常谈。当时人们对机器造成的危险争论不休,名之外“机器问题”,如今一场十分类似的争论正在进行。  由于所谓的“深度学习”通用技术,人工智能经历大量虚幻的

2016-11-15 10:44:20 8895

转载 K-Means聚类算法的4个步骤流程!

聚类分析是我们数据挖掘中常用的算法,常常用于没有分类,但又有相关相似性的样本研究当中,包括了K-Means、K-中心点和系统聚类三种算法,各自有各自的特点和适用环境。今天我们大圣众包根据网络资源详细介绍下K-Means聚类算法。  首先,先看看K-Means聚类算法是什么?一般来说,K-Means算法是典型的基于距离的非层次聚类算法,在最小化误差函数的基础上将数据划分为预定的类数K,采用距

2016-11-14 16:38:47 76430 1

原创 Apache Flink异军突起受欢迎!

大数据产业兴盛期,说到大数据分析引擎,不少人第一时间会想起Spark、Impala等,然而,作为Apache顶级项目的Flink也是不少企业的选择。它到底有什么优势呢?和Spark相比较,它有什么更可取之处呢?且听大圣众包威客平台一一道来。  一、宝剑露锋芒——Apache Flink  作为Apache的顶级项目,Flink固然集众多优点于一身,包括快速、可靠可扩展、完全

2016-11-14 11:16:16 423

转载 10个技巧,教你掌握数据处理分析!

本文是一位工程师长期工作经验的积累与总结。海量数据处理需要有效的方法和高超的技巧,没有通用的处理方法,但有通用的原理和规则。大圣众包小编分享给大家,希望能在工作中帮到你们。  1.选用优秀的数据库工具  现在的数据库工具厂家比较多,对海量数据的处理对所使用的数据库工具要求比较高,一般使用Oracle或者DB2,微软公司SQLServer2005性能也不错。另外在BI领域:数

2016-11-11 15:12:29 742

原创 2017年大数据从业者又要涨工资了!

大数据技术不断升温,相关技术人才的市场需求也日益看涨。跟随大圣众包威客平台一起来看看2017年年内预期增长幅度较高的大数据相关职位有哪些?同时,希望大家有做好准备!国外大数据相关职位薪酬范围:  1.数据科学家  2017年薪资范围:$116,000-$163,500  上涨:6.4%  2.大数据工程师  2017年薪资范围:$135,00

2016-11-11 10:15:44 1227

原创 大数据平台的搭建教程及软件工具!

按系统功能分,不同的数据平台对应着不同的常用软件。在大数据兴盛的今天,欲进军数据界的你,应该对此有更进一步的了解。以下,大圣众包威客平台将为你推介。  1.数据挖掘模块  作为一个跨学科的计算机科学分支,数据挖掘是用人工智能、机器学习、统计学和数据库的交叉方法在相对较大型的数据集中发现模式的计算过程,属于非传统的数据处理。相对于传统ETL数据处理,数据挖掘更侧重于知识发现,

2016-11-10 10:03:56 5753

转载 大数据与传统BI的区别在哪?

大数据和商业智能BI已不是陌生的词,但很多人都并不能很好区别这两者之间的关系,为了更好理解两者区别,我们大圣众包威客平台分享一篇来自网络的文章,从多个角度维度探讨大数据和BI的区别!  大数据与传统BI是社会发展到不同阶段的产物,我们从几下几个纬度来可以迅速的看出两者的区别:  第一、从数据来源角度  大数据应用的数据来源,不仅仅包括非结构化的数据,还有各种系统数据

2016-11-09 17:47:16 8144

转载 小建议:数据分析师个人该如何发展?

数据分析师对于企业来说是十分重要,技巧娴熟,经验丰富并且能深入挖掘数据、分析数据关联性的数据分析师更是难得!今天,我们大圣众包就为大家推荐miao先生关于数据分析师的该如何成长的文章!  数据理解  1、数据采集  1、了解数据采集的意义在于真正了解数据的原始面貌,包括数据产生的时间、条件、格式、内容、长度、限制条件等。同时,对数据采集逻辑的认识增加了数据分析师对数据的理解

2016-11-09 10:00:41 687

原创 推荐:java程序员必备的书单!

共享经济时代,想成为骨灰级的Java程序员,除了报班参加培训、看视频、逛社区,还可以通过看一些经典的口碑高的大牛级别书籍以增值自我。现在,大圣众包威客平台为你推荐几本必备书籍!  一、《Sun公司核心技术丛书:EffectiveJava中文版(第2版)》  此书,连Java之父——JamesGosling博士也推崇。JoshuaBloch是谷歌的首席架构师,也是本书的作者,

2016-11-08 11:01:31 814

转载 数据挖掘为什么这么难呢?

大数据时代,数据挖掘变得越加重要,曾经做了很多,成功有之,失败的却更多,今天我们大圣众包威客平台就举一些例子,探究其失败原因,也许于大家都有启示吧。  数据缺失总是存在。  为什么数据挖掘的数据准备工作要这么长时间,可以理解成取数时间很长、转换成所需的数据形式和格式时间很长,毕竟只有这样做,才能给数据挖掘引擎处理。  但数据准备的真正目的,其实是要从特定业务的角度去获取一个

2016-11-07 17:38:02 2824

转载 实战技巧:python语言的一些爬虫技巧!

今天,大圣众包威客平台借花敬佛,分享j_hao104利用Python来爬虫的经验。j_hao104用Python也差不多一年多了,Python应用最多的场景还是web快速开发、爬虫、自动化运维。  爬虫在开发过程中也有很多复用的过程,这里总结一下其中8条常用的技巧。  1.基本抓取网页  get方法  post方法  2.使用代理IP

2016-11-07 11:41:13 800

原创 实战:如何让商业智能BI效率最大化?

DT时代,数据驱动成为大趋势。所有企业都想把数据变成信息帮助决策,期望由此产生的行动能转换成更高效的业务操作,从而增加企业的竞争优势,赢在开端。此需求正好促进了商业智能BI的高速发展。然而,怎样才能令BI效率max呢?大圣众包威客平台为你支招。一、商业智能BI对企业的意义BI是一个概括性的术语,其包括应用程序、基础架构、工具以及那些能够访问并分析数据以提升和优化性能和决策质

2016-11-04 11:06:08 557

原创 为什么我从阿里巴巴辞职选择自由职业?

我在阿里巴巴做了2年多的程序员,主要工作有运营系统开发、系统运营、项目管理等方面,确实自己成长非常快,不过在大公司待久了,慢慢也觉得太乏味了,所以就决定离职出来自己“闯闯”。  刚开始是和兄弟一起做公司的,创业嘛,肯定是要成为“打杂”的——除了主要负责技术之外,其他什么都要干,老实说,不比在阿里时过得轻松,但毕竟这是梦想,也是挺乐意的。因为自己之前也在运营这块干过,大家也觉得我吹得

2016-11-03 17:08:03 1483 1

原创 2016年收入最高的5种编程语言!

电子书网站Packt发布了2016年技术提高的调查报告,它提供的统计数据基于超过11,000名IT专业人士参与的关于2016年收入最高的编程语言的调研。它同时还介绍了流行的web框架和主题。  该报告描述了IT专业人员和开发人员所使用的编程语言的趋势。在受访者中,来自美国的人数最多,其次是英国。下面一起随大圣众包小编一起看看!  最流行的5种编程语言是:  Java

2016-11-03 10:54:33 3664

转载 从业多年数据分析师的亲身经验!

大学毕业后,不知不觉的混进了电子商务行业,又不知不觉的做了三年数据分析,恰好又赶上了互联网电子商务行业发展最快的几年,也算是不错吧,毕竟感觉前途还是很光明的。三年来,学到很多关于工作、职业发展及做人的道理!  就数据分析职业来说,个人感觉这对互联网公司来说是非常重要的,也是确实能够带来实际效果的东西。比如说利用数据分析做会员的细分以进行精准化营销;利用数据分析来发现现有的不足,以作改进,让

2016-11-02 13:50:53 2680

转载 美国数据经纪对我们有什么借鉴意义?

大数据快速发展下,各国都加大力度推动大数据的发展,资产化、有价化,实现大数据的商业价值,因此,美国也形成了以数据经纪产业发展的模式,把数据商品化进行开放交易推动大数据的发展,涌现出众多的数据经纪公司、数据经纪人等,此种方式也为我国的大数据交易提供了一些思路,具体意义有如下几点。  一是大力推进公共数据开放共享。坚持政府数据以开放为原则、不开放为例外,坚持政府数据开放先行、公共数据开

2016-11-01 17:17:18 585

原创 6本值得收藏的数字图像处理书籍!

在这个看脸的时代,颜值就是一切。怎样可以成为控制颜值的“黑魔法师”?相信,阅读以下这些经典的图像处理书籍能够助你一臂之力。赶紧紧随大圣众包威客平台的脚步吧!《数字图像处理基础》  随着台式计算机的处理能力日益增强,各种图像拍摄的设备(例如平板电脑、手机摄像头、数码相机、扫描仪等)的普及,以及互联网的加持,使得数字图像处理变得与文字处理一样普及。本书就数字

2016-11-01 10:32:17 35160

原创 3款值得关注的数据分析工具!

DT时代,物联网的发展不断推动着市场推出新型的分析工具,尤其是开源数据分析工具。物联网发展的同时,带来了众多传感器及其他设备,这些设备在源源不断地生成数据流,因此,市场需要更多更全面的完善数据分析生态系统的新工具。今天就来跟随大圣众包威客平台看看3款勇敢逆袭传统数据分析工具的数据分析新星!一、ApacheKafka1.起源最初由LinkedIn开发的ApacheKa

2016-10-31 11:02:30 579

转载 机器学习初学者的正确打开方式!

通过本文你可以学习到程序员初学机器学习的四种方式(其余两种方式在下篇,敬请期待)。这是给技术人员设计的实用方法,并以实验为依据。大圣众包威客平台表示,你需要做调研并且完成实验才能建立自己的感性知识。  学习机器学习有很多方法,大多数人选择从理论开始。  如果你是个程序员,那么你已经掌握了把问题拆分成相应组成部分及设计小项目原型的能力,这些能力能帮助你学习新的技术、类库和方法

2016-10-28 16:53:28 472

转载 你知道数据运营日常主要工作吗?

数据分析本来是一份枯燥的工作,它需要你有较好的逻辑分析能力,熟练的业务能力,敏锐的行业洞察力,最终才能做到用数据驱动商业化决策。  数据分析岗位经常被称为数据运营,我认为这是除了PM和客服之外又一个接触用户的岗位。好的数据运营甚至可以成为一名优秀的产品经理、公司管理层:不仅对用户行为做到心中有“数”,对于活动及效果监控也能做到面面俱到;甚至可以预测到行业发展趋势,对公司重大决策给出决定性建

2016-09-26 16:31:24 13113

原创 3种分布式存储系统应该如何选?

当"互联网+"深入渗透至各行各业时,大数据和云计算业务也在全球范围内的飞速发展。企业想要顺应时势得到更大规模的发展,可能要面对业务发展云化。这就不得不面对一个问题——存储架构怎么选?要跟上时代的发展,应该是更精确地考虑——分布式存储架构要怎么选?大圣众包(www.dashengzb.cn)小编今天就为大家分析下各种分布式存储文件系统的特点。一、主流的3种分布式存储文件系统存

2016-09-26 11:03:39 3034

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除