![](https://img-blog.csdnimg.cn/20201014180756919.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
大数据生态圈
柒~~
大数据开发工程师——————》算法工程师
展开
-
DMP项目
DMP说明:DMP(Data Management Platform)数据管理平台,是把分散的多方数据进行整合纳入统一的技术平台,并对这些数据进行标准化和细分,让用户可以把这些细分结果推向现有的互动营销环境里的平台。1.项目背景互联网广告(本项目针对手机,OTT,PC)的崛起得益于信息技术的发展和普及,智能的终端设备迅猛的发展。互联网广告的优势:1)受众多 6-7亿网民2)可以跟踪用户...原创 2019-08-23 17:33:52 · 2546 阅读 · 0 评论 -
Hive常见问题
一. Both left and right aliases encountered in JOIN’*’ 以及 cannot recognize input near in sub1.cannot recognize这个错误主要由于每一个子查询的括号外面最好是能够有别名,所以在select * from (select * from table_name) a后面添加一个子查询的别名,就可...原创 2019-08-15 14:49:30 · 882 阅读 · 0 评论 -
Hadoop知识汇总
原理解析一·YARN调优1. yarn相关参数解析1).RM的内存资源配置, 配置的是资源调度相关RM1:yarn.scheduler.minimum-allocation-mb 分配给AM单个容器可申请的最小内存RM2:yarn.scheduler.maximum-allocation-mb 分配给AM单个容器可申请的最大内存注:最小值可以计算一个节点最大Container数量...原创 2019-08-22 15:07:12 · 126 阅读 · 0 评论