MapReduce读取数据异常（NumberFormatException，ArrayIndexOutOfBoundsException）

最新推荐文章于 2022-05-06 10:41:27 发布

TJU_ZH

最新推荐文章于 2022-05-06 10:41:27 发布

阅读量1.5k

点赞数 1

分类专栏：大数据文章标签： hadoop

本文链接：https://blog.csdn.net/beautiful_girl_love/article/details/89175681

版权

在尝试使用MapReduce分析50G大文本数据时，遇到编号异常（NumberFormatException）和数组越界异常（ArrayIndexOutOfBoundsException）。问题源于数据字段类型不匹配（如数值包含逗号）和数据格式问题（如' '导致的空值）。通过将金额字段改为String类型，增加数据有效性检查，以及重写Bean类的compareTo()方法以确保对象唯一性，最终解决了问题。

摘要由CSDN通过智能技术生成

最近实验有一个需求，分析50G左右的大文本数据，提取出指定字段，序列化对象。我想用MapReduce来进行读取，遂用MapReduce进行统计计算。首先建立bean类主要是记录Item的内部属性，如下所示：

package tju.hadoop.mapreduce;

import java.io.DataInput;
import java.io.DataOutput;
import java.io.IOException;

import org.apache.hadoop.io.WritableComparable;

/**
 * 招投标类；
 * */
public class ItemBean implements WritableComparable<ItemBean>{
	//定义项目名字；
	public String name;
	//招标单位：
	public String unit;
	//投标单位
	public String agency;
	//发布时间
	public String time;
	//预算
	public String budget;
	//实际花费
	public String amount;
	//事件识别码
	public String identifier;
	
	public String getIdentifier() {
		return identifier;
	}
	public void setIdentifier(String identifier) {
		this.identifier = identifier;
	}
	public ItemBean(String identifier,String name,String unit,String agency,String time,String budget,String amount) {
		this.name = name;
		this.unit = unit;
		this.agency = agency;
		this.time = time;
		this.budget = budget;
		this.amount = amount;
		this.identifier = identifier;
	}
	public ItemBean() {}

	public String getName() {
		return name;
	}

	public void setName(String name) {
		this.name = name;
	}

	public String getUnit() {
		return unit;
	}

	public void setUnit(String unit) {
		this.unit = unit;
	}

	public String get

最低0.47元/天解锁文章

TJU_ZH

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
MapReduce读取数据异常（NumberFormatException，ArrayIndexOutOfBoundsException）

最近实验有一个需求，分析50G左右的大文本数据，提取出指定字段，序列化对象。我想用MapReduce来进行读取，遂用MapReduce进行统计计算。首先建立bean类主要是记录Item的内部属性，如下所示：package tju.hadoop.mapreduce;import java.io.DataInput;import java.io.DataOutput;import jav...
复制链接

扫一扫

专栏目录