自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 资源 (6)
  • 收藏
  • 关注

原创 初探大数据-Spark系列-实战一

MapReduce的局限性:1)代码繁琐;2)只能够支持map和reduce方法;3)执行效率低下;4)不适合迭代多次、交互式、流式的处理;框架多样化:1)批处理(离线):MapReduce、Hive、Pig2)流式处理(实时): Storm、JStorm3)交互式计算:Impala学习、运维成本无形中都提高了很多前置要求:1)Building Spark using Maven requires...

2018-03-08 17:11:04 247

原创 初探大数据-hive架构分析-实战五

官网地址hive.apache.org架构解析:一、Hive底层的执行引擎有:MapReduce、Tez、Spark    Hive on MapReduce    Hive on Tez    Hive on Spark压缩:GZIP、LZO、Snappy、BZIP2..存储:TextFile、SequenceFile、RCFile、ORC、ParquetUDF:自定义函数二、Hive环境搭建1...

2018-03-05 10:56:40 669

原创 初探大数据-YARN架构分析-实战四

YARN架构1 RM(ResourceManager) + N NM(NodeManager)ResourceManager的职责: 一个集群active状态的RM只有一个,负责整个集群的资源管理和调度1)处理客户端的请求(启动/杀死)2)启动/监控ApplicationMaster(一个作业对应一个AM)3)监控NM4)系统的资源分配和调度NodeManager:整个集群中有N个,负责单个节点的...

2018-03-02 17:44:13 294

原创 初探大数据-HDFS shell常用操作-实战三

1、)操作hadoop fs -mkdir /testhadoop fs -mkdir -p /a/bhadoop fs -mkdir -R /a/b传数据                        源        目标hadoop fs -put hdfs.cmd /test/删除数据文件                        源  hadoop fs -rm /test/hdfs...

2018-03-02 17:13:23 214

原创 初探大数据-开发环境安装-实战二

软件存放目录hadoop/hadoop/home/hadoop    software: 存放的是安装的软件包    app : 存放的是所有软件的安装目录    data: 存放的是课程中所有使用的测试数据目录    source: 存放的是软件源码目录Hadoop环境搭建1) 下载Hadoop    http://archive.cloudera.com/cdh5/cdh/5/    2.6....

2018-03-02 16:24:10 206

原创 初探大数据-开发环境介绍-实战一

使用环境:1、centos(6.4)2、hadoop版本对比及选择    生产较多的CDH版本(CDH5.7.0)    下载地址:课程整套CDH相关的软件下载地址:http://archive.cloudera.com/cdh5/cdh/5/    cdh-5.7.0   生产或者测试环境选择对应CDH版本时,一定要采用尾号是一样的版本    为什么很多公司选择Hadoop作为大数据平台的解决方...

2018-03-01 16:21:49 772

原创 Golang 学习一:开发环境搭建-入门必备

一、下载适合本机的Golang版本语言SDK安装地址: golang: https://studygolang.com/dl注意对应好自己PC 的system. Windows 直接下载对应的msi安装即可,Linux注意发行版本。 本文Linux选择go1.8.1.linux-amd64.tar.gz版本。二、Golang安装1.windows安装的过程比较简单,基本上直接默认安装即可...

2018-02-28 11:43:22 641

联通大数据精准营销产品介绍.pdf

运营商大数据具备全面性、多维性、中立性、完整性是其它企业很难比拟的,而且通过这些不同维度数 据的交叉关联,可以创造更多的新数据和新价值

2020-04-10

联通大数据 AI赋能-人脸识别.pdf

人脸识别,人脸识别是AI创新应用中心具备完全自主产权五大原子能力产品(人脸识别、人体识别、物体识 别、环境识别、自然语言处理)之一。 AI创新应用中心使命:打造AI基础能力,围绕典型场景自主研发核心能力,实现成果全网共享, 形成集约化AI赋能体系

2020-04-10

购物中心洞察报告样例.pdf

居家人群属性定义:数据月累计后通过常规居家的时间锁定居家区域,当人群进入定义的居家区域后标记为居家人群,判断单位为个人,且个人只有一个 居家属性,如居家区域和工作区域重合,系统会将工作属性划为居家属性 从下图可看出区域内在凌晨时段为居家属性当日峰值日,峰值可达75万人左右,本区域的住家人口相对较为集中;由于居家属 性的定义,该区域内的高校人群的宿舍和教学楼距离较近的在判别过程中会将在校人群划为居家人群

2020-04-10

动态标签产品说明(外部).docx

在保证数据安全的前提下,动态标签构建了一套基于用户动态的、互联网使用行为的标签输出产品。该产品可结合企业客户的自身平台直接进行潜在客户的拓展营销,也可与企业的标签体系相融合,产生更大的效益。

2020-04-10

大数据运行组件图

大数据运行组件图 某公司架构 只为挣分而发,绝对有价值,没的话可以扔砖过来

2014-01-10

大数据核心架构图

大数据核心架构图 某公司核心设计,只为挣分,绝对有价值。

2014-01-10

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除