- 博客(10)
- 资源 (4)
- 收藏
- 关注
转载 Spark环境安装部署教程
Apache Spark 是一个新兴的大数据处理通用引擎,提供了分布式的内存抽象。Spark 正如其名,最大的特点就是快(Lightning-fast),可比 Hadoop MapReduce 的处理速度快 100 倍。此外,Spark 提供了简单易用的 API,几行代码就能实现 WordCount。本教程主要参考官网快速入门教程,介绍了 Spark 的安装,Spark shell 、RD
2017-12-05 09:57:44 806
原创 在互联网行业干数据分析师,都需要掌握哪些技能?编程语言?软件工具?
在互联网行业做数据分析师,不仅需要具备扎实的统计学理论基础,同时对于编程的要求也很高,因为互联网与传统行业不同的是数据完全依赖与系统产生,无论是客户信息、用户行为还是整个业务流程的各个环节都来自于对应的软件系统,包括app、web客户端或者后台的客户关系管理、数据仓库、系统日志等等。
2017-12-04 11:31:09 6715 1
原创 web前端工程师还没参加工作,项目经验咋积累?用这个办法模拟项目经验非常好,找工作好找多了。
随着技术的发展与革新,优秀的前端框架层出不穷,还没有在选择上拿捏准确的时候,却发现根本学不过来,学了点皮毛又很快忘掉,因为并不是学以致用,可能是出于好奇心、危机感等等原因解除了一些新的知识,但讲起来头头是道,知识面看起来很广,但却经不住推敲,因为很多人并没有真正的在实际应用中去收获真正的核心价值,所以,其实对于前端工程师来讲,会多少种框架并不重要
2017-11-30 22:23:56 6837 1
原创 微软MSBI零基础从数据仓库到商业智能实战(SSIS SSAS SSRS)
微软MSBI介绍微软MSBI是微软公司的一套商业智能解决方案,产品基于SQL SERVER基础上提供了,SSIS用于ETL,SSAS多维分析工具与SSRS报表展示工具等,一般用SQL SERVER作为数据仓库,支持MDX多维分析数据查询语言,用于OLAP分析。适合人群:数据仓库工程师、ETL工程师、BI工程师MSBI课程体系设置第一阶段:MSBI快速入门微软MS
2017-11-21 21:33:16 7039 3
转载 从零开始搭建Hadoop2.7.1的分布式集群
Hadoop 2.7.1 (2015-7-6更新),Hadoop的环境配置不是特别的复杂,但是确实有很多细节需要注意,不然会造成许多配置错误的情况。尽量保证一次配置正确防止反复修改。网上教程有很多关于Hadoop配置的,但是每一个教程都对应了一个版本信息,有一些教程也存在很大的问题,配置环境,系统环境都没说清楚。在此我将记录下来从零搭建Hadoop2.7.1的过程,以及搭建过程中所遇到的一
2017-11-21 21:28:53 894
转载 storm技术架构讲解之storm对比hadoop
Storm是一个分布式的、高容错的实时计算系统。Storm对于实时计算的的意义相当于Hadoop对于批处理的意义。Hadoop为我们提供了Map和Reduce原语,使我们对数据进行批处理变的非常的简单和优美。同样,Storm也对数据的实时计算提供了简单Spout和Bolt原语。
2016-12-26 16:24:26 4368
转载 CSS hack 多DIV嵌套 自适应高度问题
百度权重查询 站长交易 友情链接交换 网站监控 服务器监控 SEO监控我们做DIV+CSS布局时常常如下的做多层DIV的嵌套,可是我们却发现不管是在IE8 还是FF下都层在毛病。在IE8和FF下,DIV 1的边框变成了一条直线,并没有随着内部两个DIV的内容而撑大,原来是因为如果父级DIV没有定义高度,并且内容为空时所定义样式将无效。1、当我们这样直接使用时……ul,p,t
2013-05-27 15:48:56 1276
原创 不要做麻木的IT公民
关于避免IT工作中工作压力导致的身心不健康,我们对职业要有一个发展规划。决不能单纯为了工资、为了生活等事情限制我们,那样巨大压力和枯燥的生活导致了无限巨大疲惫感。大家一起来提出好的解决办法,让我们的IT工作更加的有动力!!
2010-06-29 10:19:00 616
转载 数据库优化前的10个问题
在优化你的数据库时,你可能没有用到这些细节的优点。以下是10个关于你的数据库性能的问题,需要你问问自己。 1. 假设你的数据库不需要存储特殊字符的能力,尤其是Unicode标准中规定的那些字符,你有没有在系统中把nchar类型替换成char之类的各种适用的字段类型? 2. 你是不是在用smalldatetime类型,而不是datetime?如果你不清楚这两种类型有什么区别,这是
2010-04-06 16:13:00 373
转载 聚合策略中选择OLAP还是聚合表
摘要:为了实现对出于做报表和分析的需要所作的查询做出最快的回应,数据库系统面临着艰巨的挑战。这个挑战突出了数据库设计中的一对根本矛盾:即最快还是最好。聚合策略中选择OLAP还是聚合表 为了实现对出于做报表和分析的需要所作的查询做出最快的回应,数据库系统面临着艰巨的挑战。这个挑战突出了数据库设计中的一对根本矛盾:即最快还是最好。数据库可以存储最小单位的数据量以保持运行速度最快;但
2010-04-06 15:41:00 905
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人