我有一个用平面文件编写的员工记录的场景,例如:
flatFile.txt
============
1|name1|dept1|10000
2|name2|dept2|12000
3|name3|dept3|9500
....
....
现在,我想阅读这个平面文件,每次将上面的员工记录转换成一些新的xml文件,因此最后我应该拥有带有以下数据的xml文件:
1
name1
dept1
10000
2
name2
dept2
12000
...
...
现在要实现这个概念,我需要注意以下数据的验证:
> ID&工资应该是数字
>名称长度应小于20
>平面文件的一行应包含以上4个字段
如果任何验证失败,则需要将其与错误行号一起反映在xml文件中,例如:
(name length is greater than 20 in 2nd record of a flat file)
要么
(first record doesn't contains enough fields)
现在,需要以这样的方式设计应用程序,使组件可以通过替代品插入.例如应该有可能用另一个将定界符为基础的输入文件解析器替换为固定长度的解析器.
所以我将不得不以某种方式分层设计概念,例如
Parsing -> Validation -> Output Generation.
现在为了实现这个概念,我给出了一个想法,如下:
>使用BufferedReader从文件中读取所有记录,并使用StringTokenizer将其标记化.
>初始化每个记录的雇员对象,并将它们添加到某个集合(列表)中.
>将错误(字段不匹配或任何其他失败的验证)维护到Map>中.
>使用某些XML Builder API将列表写入或编组为xml(不清楚哪种方法最好).
谁能给我更好的建议或实现实现的任何提示?