java实现数据预处理_Java编程通过匹配合并数据实例解析(数据预处理)

本文研究的主要是Java编程通过匹配合并数据(数据预处理)的相关内容,具体如下。

数据描述

以下程序是对如下格式的数据进行合并处理。

7b5248729e47954a0ded5173cd3a0e8f.png

这个表的每一行表示用户id及用户的特征。其中,一个用户只有一个特征向量,即第一列不会重复。

e7cff280e48d7a0c363d57756f3790d0.png

这张表的第一列,表示用户的id,第二列表示用户所看的电影,第三列表示用户对电影的打分(1-13分),第四列表示用户对电影的打分,但分值范围是1-5分。

问题描述

在做数据预处理时,如何将第二张表添加上用户特征呢?其实,方法很简单,将第二张表的用户id与第一张表的用户id进行匹配就行。合并结果如下图所示。

7eefbf9e52cf7416f272a827d55bd2c4.png

数据处理程序

package deal;

import java.io.BufferedReader;

import java.io.File;

import java.io.FileInputStream;

import java.io.IOException;

import java.io.InputStreamReader;

import java.math.BigDecimal;

import java.util.ArrayList;

import java.util.HashMap;

import java.util.List;

/*

* author:合肥工业大学 管院学院 钱洋

* email:1563178220@qq.com

*/

public class GetPUser {

public static List readDocs(String docsPath,String code) throws IOException{

BufferedReader reader = new BufferedReader( new InputStreamReader( new FileInputStream( new File(docsPath)),code));

String s=null;

List userproductscore=new ArrayList();

while ((s=reader.readLine())!=null) {

userproductscore.add(s);

}

reader.close();

return userproductscore;

}

public static HashMap MAPread(String docsPath1,String code1) throws IOException{

BufferedReader reader1 = new BufferedReader( new InputStreamReader( new FileInputStream( new File(docsPath1)),code1));

String s1=null;

HashMap userfeaturemap=new HashMap();

while ((s1=reader1.readLine())!=null) {

String arr[]=s1.split("\t");

String feature="";

for (int i = 1; i < arr.length; i++) {

BigDecimal db = new BigDecimal(arr[i]);

String ii = db.toPlainString();

feature+=ii+" ";

}

userfeaturemap.put(s1.split("\t")[0], feature);

}

reader1.close();

return userfeaturemap;

}

public static List match(List userproductscore,HashMap userfeaturemap) throws IOException{

List userscoreandfeature=new ArrayList<>();

for (int i = 0; i < userproductscore.size(); i++) {

//获取用户id

String user_id=userproductscore.get(i).split("\t")[0];

//获取用户特征

String userfeature = userfeaturemap.get(user_id);

userscoreandfeature.add(userproductscore.get(i)+"\t"+userfeature);

System.out.println(userproductscore.get(i)+"\t"+userfeature);

}

return userscoreandfeature;

}

public static void main(String[] args) throws IOException {

//读取两个文本

List userproductscore=readDocs("data/train/ydata-ymovies-user-movie-ratings-train-v1_0.txt","gbk");

HashMap userfeaturemap=MAPread("data/fileofuser/yahoo.txt","utf-8");

//匹配结果

match(userproductscore,userfeaturemap);

}

}

总结

以上就是本文关于Java编程通过匹配合并数据实例解析(数据预处理)的全部内容,希望对大家有所帮助。感兴趣的朋友可以继续参阅本站其他相关专题,如有不足之处,欢迎留言指出。感谢朋友们对本站的支持!

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值