最近将movielens数据集rate.dat原来格式:userid,itemid,rating,timestamp按要求转换为(userid,item1,item2....),按时间的前后展示用户的所以观看电影记录。我是首先将数据导入到mysql数据库,利用数据库的容易对数据排序的特点,将其按时间字段进行排序,将排序的查询结果导出到本地文件,
select userID,movieID,timestamp into outfile1 ‘/var/lib/mysql/outfile.txt‘ from movie_jieguo2 order by userID,timestamp;
1 168
874965478
1172874965478
1165874965518
1156874965556
1166874965677
接下来,考虑将每一个用户的观看电影记录连接起来,运用java的hashmap进行处理
public static voidmain(String[] args) {
String line=null;
StringBuilder sb=newStringBuilder();
Map movie_time = new HashMap();try{
LineNumberReader lineReader= new Lin