最近在公司里做一些小工具,经常会涉及到对Excel数据的操作。起初,我只是简单把Excel视作行和列的组合,把它当一个Table来实现,但是客户提供的Excel表中的数据的格式很随意、不严格,发现的问题有:
- Excel中经常会有标题行。
- Excel中数据列的取名不严格,例如:身份证号,有些Excel 中是身份证件号,身份证件号码等等之类的。
- Excel中列名中会包含空格键。
- Excel中会有无数据的行和列。
这些问题归纳起来可以分为2类:1.是数据的过滤;2.格式的修整。因此,我萌生了自己来写一个将Excel中的数据读取转成一个DataSet的类的想法。我希望这个类能处理以上的情况,这个类能很方便的扩展以处理没考虑到的情况,这个类可以使用XML文件来配置,这个类的实现不依赖于其他类。