最近自己一个人报了泰迪杯的数据挖掘大赛,期间一度想要放弃,但是看到身边的人一个个退出以后,感觉自己变得更有机会,于是耐心做了一下。
数据处理是一个很大的问题,题目给出的自定义时间在matlab直接导入无法读取,但是作为一个字符串读入操作复杂,并且还有各种错误。
2018/1/25 14:55:44 |
为了节省时间,先把需要处理数据都拷贝到txt,用matlab读取txt的信息。这样读取的每个时间都变成了字符串的形式。
然后用如下代码对时间数据进行处理变形,再存储到其他的文件中即可。该博客采用输出到新的txt文件中,输出到xlsx文件也不在话下了。
fid=fopen('newTxt.txt','wt'); %用以存储处理后数据的txt文件
url = ['data.txt']; %用以获取信息的文件
fpn = fopen (url, 'rt'); %打开文件
while feof(fpn) ~= 1 %迭代器
file = fgetl(fpn);
new_str = file(11:12) %可以对时间信息进行处理,如例子为把小时折算成秒
new_str = new_str*24*60
fprintf(fid,'%s\n',newTxt);%新的字符串写入当新建的txt文档中
end
fclose(fid);