配置文件概念
一个灵活的系统不可缺少的一部分,虽然重要,却没有标准
windows上的配置文件:特殊化的ASCII文件(以”ini”为文件拓展名)
java配置文件:java.util.Properties类,用于处理简单的配置文件 k-v
Hadoop Configuration:采用XML格式
1.name、value、description、final
final作用与java中类似,表示:在合并资源的时候,可以防止配置项的值被覆盖
2.属性都是String类型,但是值是各种类型的:
getInt(“io.sort.factor”)返回值为整数10
3.core-default.xml和core-site.xml,通过Configuration类的loadResources()合并成一个配置文件:
Configuration conf=new Configuration();
conf.addResource(“core-default.xml”);
conf.addResource(“core-site.xml”);
如果两个配置文件包含了相同的配置项,切前一个没有标记final,那么后面的配置覆盖前面的配置
—----------->
构造Configuration对象,通过addResource()方法添加需要加载的资源;然后使用get*和set*方法访问和设置配置项
分析Configuration类
- 保存在defaultResource这个集合中的配置:
- addDefaultResource静态方法调用
- 该类properties中的数据使用了延迟加载模式,当需要时加载进来,调用getProps()时:
XML配置文件解析
SAX解析:
提供了一种流式的,事件驱动的xml处理方式,编写处理逻辑比较复杂,比较适合处理大的xml文件
DOM解析:
首先将xml文件一次性装入内存,然后根据文档中定义的元素和属性在内存中创建一个“树形结构”,hadoop的xml文件很小,使用这种方式合适。
- 在loadResource(Properties pro,Object name,boolean quiet)中使用了dom解析:
Configurable接口
如果一个类实现了该接口,意味着这个类是可配置的,也就是说,可以通过这个类的对象传入一个Configuration实例,提供对象工作需要的一些配置信息。
ReflectionUtils的一个静态方法: