JAVA中的format

一般会使用SimpleDateFormat子类，newSimpleDateFormat("yyyy-MM-dd")或newSimpleDateFormat("yyyy-MM-dd HH:mm:ss")，来获得常用的时间格式。DateFormat 的get***Instance()方法一般也是获得SimpleDateFormat。

看DateFormat的源代码有个疑问，如果继承了DateFormat类，那DateFormat. get***Instance()的方法还是返回SimpleDateFormat？ DateFormat.get是私有的，也不能覆盖。

DateFormat类中还有一些static的字段，如WEEK_OF_MONTH_FIELD,WEEK_OF_YEAR_FIELD。api上说在FieldPosition中使用，用于对齐。

java.util.Calendar也是日期操作相关的类，实现类为GregorianCalendar。主要对日期进行操作。注意add方法和roll方法的区别，roll方法不更改更大的字段。还有一些静态的变量DAY_OF_MONTH，DAY_OF_WEEK等，在get/set/add/roll方法中使用。

1.4. MessageFormat的用法

和SimpleDateFormat一样，也需要传入一个pattern。如

String result = MessageFormat.format(

"At {1,time} on {1,date}, there was {2} on planet{0,number,integer}.",

7,new Date(), “ a message ”);

其中

{1,time}中1是指第几个参数，time是指格式化的类型。根据api进行设置，是调用NumberFormat和DateFormat进行格式化的。

还可以调用parse方法将字符串转化为Obejct。

1.5. NumberFormat的用法

1.5.1.NumberFormat的介绍

NumberFormat 是所有数字格式的抽象基类。类结构与DateFormat类似。主要也是通过get***Instance方法获得实现类DecimalFormat。

比较常用的方法有：

setParseIntegerOnly：只影响分析。设为true,则忽略小数点以后的位置。

setDecimalSeparatorAlwaysShown：只影响格式化，且只影响小数点后没有数字的情况?设置分组符号是否显示。例如1,234中的,号是否显示。

setGroupingUsed：是否分组。如果此格式中使用了组，则返回 true。例如，在英国语言环境中，如果设置了组，则数 1234567 可能被格式化为 "1,234,567"。

还可以设置小数/整数部分的最大/小位数。

关于parse方法中的ParsePosition和 format方法中的FieldPosition待研究。

1.5.2. 子类DecimalFormat

DecimalFormat 是NumberFormat 的一个具体子类，用于格式化十进制数字。在DecimalFormat中传入pattern，可以自定义格式化类型。舍入方式是half-even（四舍五入）。

DecimalFormat 模式包含正数和负数子模式，例如 "#,##0.00;-#,##0.00"。;后面的代表负数模式。单独的 "0.00"等效于 "0.00;-0.00"。如果存在显式的负数子模式，则它仅指定负数前缀和后缀；

0：代表是数字；如果不存在则显示为0;

#：代表是数字;

,：分组分隔符；没有则不分组

1.5.3. 子类ChoiceFormat

ChoiceFormat通常用于在MessageFormat 中处理复数。创建 ChoiceFormat 时，可以指定一个 format 数组和一个limit 数组。这些数组的长度必须相同。

如api中用于转换星期的例子

double[] limits = {1,2,3,4,5,6,7};

String[] monthNames ={"Sun","Mon","Tue","Wed","Thur","Fri","Sat"};

ChoiceFormat form = new ChoiceFormat(limits,monthNames);

ParsePosition status = new ParsePosition(0);

for (double i = 0.0; i <= 8.0; ++i) {

status.setIndex(0);

System.out.println(i + " -> "+ form.format(i) + " -> "

+form.parse(form.format(i),status));

}

form.format(i)根据limits的数字转换为星期几的名称。limits中的数字必须按升序排列，如果提供的数字不在limits中，则选择使用第一个或最后一个索引。

form.parse(form.format(i),status)，则根据Name转换为limits中的值。

1.5.4. ChoiceFormat的例子

下面是ChoiceFormat的api中一个较复杂的带模式格式的例子, 和MessageFormat一起使用：

//生成ChoiceFormat

double[] filelimits = {0,1,2};

String[] filepart = {"are nofiles","is one file","are {2} files"};//这里的2是指从testArgs中取第二个元素的值

ChoiceFormat fileform = newChoiceFormat(filelimits, filepart);

//定义Format数组testFormats，分别为ChoiceFormat,null,NumberFormat

//ChoiceFormat用于{0}, null用于{1},NumberFormat用于{2}

Format[] testFormats = {fileform, null,NumberFormat.getInstance()};

//将MessageFormat的formats设为testFormats

//testFormats中的格式顺序对应于模式字符串中的格式元素的顺序

//最好使用setFormatsByArgumentIndex方法，而不是使用setFormats

MessageFormat pattform = newMessageFormat("There {0} on {1}");

pattform.setFormats(testFormats);

//进行fomat

Object[] testArgs = {null, "ADisk",null};

for (int i = 0; i < 4; ++i) {

testArgs[0] = new Integer(i);

testArgs[2] = testArgs[0];

//此时的testArgs值为{0, "ADisk",0}

//根据MessageFormat的定义，对testArgr元素进行处理

System.out.println(pattform.format(testArgs));

}

1.5.5. ChoiceFormat的pattern构造方法

ChoiceFormat还有另外一个构造方法，传入pattern。

为ChoiceFormat 对象指定一个模式是相当直接的。例如：

ChoiceFormat fmt= new ChoiceFormat(

其中数字#是按照大小顺序排列的， formate方法中传入参数x，如果x在0,1之间，则按照0处理。

1.5.6. 其它的数字格式化

另外在对数字进行格式化时，也可以考虑使用java.math.BigDecimal。

如setScale(int newScale,int roundingMode)：newScale指精确度，即保留几位小数。roundingMode指舍入模式，常用的是四舍五入。DecimalFormat貌似只能使用四舍五入，如果使用别的舍入方式，就要使用BigDecimal了。

java.lang.Integer中的几个转换进制的方法也比较实用

toBinaryString(int i)：以二进制（基数 2）无符号整数形式返回一个整数参数的字符串表示形式。

toHexString(int i)：以十六进制的无符号整数形式返回一个整数参数的字符串表示形式

toOctalString(int i) ：以八进制（基数 8）无符号整数形式返回一个整数参数的字符串表示形式。

2. java.util.Formatter

2.1. 介绍

Formatter类是个final的class，printf 风格的格式字符串的解释程序，和java.text.Format中的功能有很多重复的地方。

Formatter比较常见的使用方法是String.format(format,args)，System.out.printf(format,args)等。这里只是简单总结一下，详细的参照api。下面的每节是对格式说明符中的元素的说明。

常规类型、字符类型和数值类型的格式说明符的语法如下：

%[argument_index$][flags][width][.precision]conversion

其中%和conversion（转换类型）是必须的，

%表示正则表达式的开始。

可选的argument_index$，指的是参数在参数列表中的位置。如果设定argument_index$，则按照args的顺序依次处理。

可选的 flags(标志) 是修改输出格式的字符集。有效标志的集合取决于转换类型。

可选 width(宽度) 是一个非负十进制整数，表明要向输出中写入的最少字符数。

可选 precision(精度) 是一个非负十进制整数，通常用来限制字符数。特定行为取决于转换类型。

2.2. 转换(conversion)

转换是核心，按参数类别可以分为常规，字符，整数，浮点，日期/时间，百分比，行分隔符。不区分大小写。

2.2.1. 常规

常规的返回值为字符串，有:

b：结果为“true/false”。参数 arg 为 null或boolean/Boolean型的false时，返回字符串的“false”。否则返回字符串的“true”。

h：结果为十六进制的字符串。如果参数 arg 为 null，则结果为 "null"。否则，结果为调用Integer.toHexString(arg.hashCode()) 得到的结果。

s：比较常用的转换，取得字符串。如果参数 arg 为 null，则结果为 "null"。如果 arg 实现 Formattable，则调用 arg.formatTo。否则，结果为调用 arg.toString() 得到的结果。

2.2.2.字符

c: 结果是一个 Unicode 字符

2.2.3.整数

是对进制的操作,有：

d：结果被格式化为十进制整数

o：结果被格式化为八进制整数

x：结果被格式化为十六进制整数

2.2.4.浮点

e：结果被格式化为用计算机科学记数法表示的十进制数

f ：结果被格式化为十进制数

g：根据精度和舍入运算后的值，使用计算机科学记数形式或十进制格式对结果进行格式化

a：浮点结果被格式化为带有效位数和指数的十六进制浮点数

2.2.5.日期/时间

t：日期和时间转换字符的前缀。对于日期/时间的转换，以t开头再指定转换内容。

如Calendar c = newGregorianCalendar(1995, MAY, 23);

String s =String.format("Duke's Birthday: %1$tm %1$te,%1$tY", c);

具体参数的意义参照api。

2.2.6.百分比

%：结果为字面值 '%'。

2.2.7.行分隔符

n：生成一个换行符。为平台相关。

2.3. 标志(flags)

标志有'-'，'#'，'+'，' '，'0'，','，'('。常用的是'-'：将结果设为左对齐。同时flag的使用依赖于conversion。

2.4. 宽度(width)

宽度是将向输出中写入的最少字符数。对于行分隔符转换，不适用宽度，如果提供宽度，则会抛出异常。

2.5. 精度(.precision)

对于常规参数类型，精度是将向输出中写入的最多字符数。

对于浮点转换 'e'、'E' 和 'f'，精度是小数点分隔符后的位数。

如果转换是 'g' 或 'G'，那么精度是舍入计算后所得数值的所有位数。如果转换是 'a' 或 'A'，则不必指定精度。

精度的优先级大于宽度。

3. java.util.regex.Pattern

3.1. 介绍

Pattern（模式）是正则表达式的编译表示形式，经常和java.util.regex.Matcher。Pattern没有提供构造函数。通过调用Pattern. compile (String regex)方法来获得实例。pattern.matcher (CharSequence input);来判断是否input是否可以与regex匹配。compile

通过Matcher m = p.matcher("aaaaab");方法来获得Matcher。

pattern.split(CharSequence input);可以将input分隔成一个String数组。

3.2. 关于regex

字符类比较常用， []是对字符的罗列。如[abc]。[a-z&&[^bc]] 的解释为a 到 z，除了 b 和 c：[ad-z]（减去）。

还有字符，预定义字符类，边界匹配器也比较常用。具体参照api。

Greedy 数量词也需要了解。

X? 表示X，一次或一次也没有

X* 表示X，零次或多次

X+ 表示X，一次或多次

X{n} 表示X，恰好 n 次

X{n,} 表示 X，至少 n 次

X{n,m} 表示X，至少 n 次，但是不超过 m 次。

Greedy 数量词，这种匹配原则就叫作"贪婪" 模式。总是尽可能多的匹配符合它规则的字符。

Reluctant 数量词，Possessive 数量词不晓得有啥区别。

组和捕获：捕获组可以通过从左到右计算其开括号来编号。如(ca)(t)。

3.3. Matcher(匹配器)

通过调用模式的 matcher 方法从模式创建匹配器。创建匹配器后，可以使用它执行三种不同的匹配操作：

matches 方法尝试将整个输入序列与该模式匹配。 注意是整个输入字符串。

lookingAt 尝试将输入序列从头开始与该模式匹配。

find 方法扫描输入序列以查找与该模式匹配的下一个子序列。

方法:

matcher.appendReplacement(StringBuffersb, String replacement)：实现非终端追加和替换步骤。就是将模式匹配到的字符串，替换为replacement，并将区域加入到sb中。区域的操作，参看match.region，match. regionStart, match.regionEnd。

matcher.appendTail(StringBuffersb) 实现终端追加和替换步骤。可以在一次或多次调用appendReplacement 方法后调用它来复制剩余的输入序列。Tail的意思尾部，也就是剩余的意思。这里的终端应该就是指尾部。

matcher.replaceAll(Stringreplacement)：替换模式与给定替换字符串相匹配的输入序列的每个子序列。比较方便的方法，用replacement直接替换掉与模式匹配的字符串。

与模式中的组和捕获相关的方法，有match.group，match.groupCount。如模式(ca)(t)的groupCount就是2。