- 博客(4)
- 收藏
- 关注
原创 MapReduce项目书写
导入相关jar包 写一个job类 job类的部分代码:public static void main(String[] args) throws IOException, ClassNotFoundException, InterruptedException { Configuration conf = new Configuration(); Job j
2017-09-24 21:32:53 266
原创 数据仓库
数据仓库是一种信息系统,它能给一个组织或机构提供商务智能(business intelligence)以支持管理决策的制定。 数据仓库是 面向主题的 集成的 稳定的 随时间增量的 数据集合,用以支持管理决策 元数据:关于数据的数据,指在数据仓库建设过程中所产生的有关数据源定义,目标定义,转换规则等相关的关键数据。同时元数据还包含关于数据含义的商业信息。 粒度:数据仓库的数据
2017-09-23 21:17:58 325
原创 hive
hive的基本操作创建表 create table city( province_code INT, province_name string, city_code INT, city_name string ) row FORMAT delimited fields terminated by ',' lines terminated by '\n';导入本地源表
2017-09-16 21:57:36 313
原创 多线程
多线程标签: 从软件或者硬件上实现多个线程并发执行的技术。 引入线程的主要动机在于提高程序的运行性能。2017.9.15 提出多线程的原因: 在一个程序中主要存在使用CPU和IO操作的两类计算。IO操作相对CPU运算来说比较耗时,而且很多都是阻塞式。当一个线程所执行的IO操作被阻塞时,同一进程中的其他线程可以使用CPU来进行计算。在资源允许时,多个线程可以同时进行IO操作。这种方式提
2017-09-15 20:22:13 183
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人