测试1
附件Access数据库(test.mdb)中的“来访者登记表”是SARS期间某城市的火车站的登记表的电子录入表格,
(大约有1万条记录,这里只是一段个样本数据)。
需要写一个程序将表格进行一个统计和排序,输出到一个文本文件中。
要求:
数据输出文件后缀名为".csv",数据项之间用半角的逗号分隔,每条数据回车换行分隔。格式说明如下:
第一行数据是固定的标题项,固定文本:
"身份证号,来自城市,最近一次来访时间,来访次数"
第二行开始是数据项,按照第一行的顺序输出。
《SARS期前来访人员统计输出样例.csv》是一个给出的样本数据的格式例子供参考
数据排序,按照来自城市排序,5个城市按照下面的列表顺序固定排序放在数据输出的最前面,其他城市按照字符串的比较顺序排序
5个固定的城市顺序为:
北京
上海
广州
深圳
成都
“最近一次来访时间”是指某个人员最近一次到访这个城市的时间,输出请按照 "yyyy-MM-dd"的格式填写。
"来访次数" 是指这个人来访这个城市的次数,不是指火车的车次
请用C#或者Java写一个处理程序
要求代码清晰,易维护,可读性好,执行效率高,如果算法比较复杂请给出适当的算法说明
注意:
由于是手工录入数据,所以“进入日期”这个字段可能被填写成多种多样的格式
95%的格式如下几种形式:
"2003/3/14"
"2003-3-14"
"2003.3.14"
"2003.03.14"
"20030304"
"2003年3月14日"
当然5%还有个别其他的写法,程序里面需要做相应的处理操作,请给出你的处理思路和为什么这么处理的原因
<!--StartFragment -->
<!--StartFragment -->
测试2
请写一个程序找出附件中文件重复的行
输出:
输出一个文本文件,给出哪些行是重复的,第一次出现的行号,格式如下
行号 此行的文本内容
并给出此程序的运行时间
请用C#或者Java写一个处理程序
要求代码清晰,易维护,可读性好,执行效率高,如果算法比较复杂请给出适当的算法说明
<!--StartFragment -->