![](https://img-blog.csdnimg.cn/20201014180756930.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
大数据
文章平均质量分 77
无言沉默
从事c/c++工程师工作,目前学习大数据技术
展开
-
Spark笔记
spark 是使用scala语言实现的 spark生态圈也称作BDAS(伯克利数分析栈),是伯克利APM实验室开发的,力图在算法、机器、人之间通过大规模集成来展现大数据应用的一个平台。伯克利AMPLab运用大数据、云计算、通信等各种资源以及各种灵活的技术方案,对海量不透明的数据进行甄别并转化为有用的信息,以供人们更好的理解世界。该生态圈已经涉及到机器学习、数据挖掘、数据库、信息检索、自然原创 2017-07-19 18:13:34 · 486 阅读 · 0 评论 -
hive数据仓库笔记
将csv导入hive中 1、首先在hive中创建自己的table, 并且设置分隔,如'\t'。 create table IP(ip varchar(30), country varchar(30), province varchar(30), city varchar(30), district varchar(30), linetype varchar(30)) row form原创 2017-07-27 11:46:07 · 402 阅读 · 0 评论