[error handle][mahout] 由于空字符串错误导致model创建失败

REASON

图书馆项目,今天想测试下mahout的图书推荐算法。

借阅数据有30多万条,用kettle处理过后是这样

long,long,flout型,用逗号隔开,符合要求。


ERROR

运行后报错,model = new FileDataModel(new File(INPUTPATH));   语句错误,提示空字符串错误。

错误信息:

Exception in thread "main" java.lang.NumberFormatException: For input string: ""

at java.lang.NumberFormatException.forInputString(Unknown Source)
at java.lang.Long.parseLong(Unknown Source)
at java.lang.Long.parseLong(Unknown Source)
at org.apache.mahout.cf.taste.impl.model.file.FileDataModel.readUserIDFromString(FileDataModel.java:638)
at org.apache.mahout.cf.taste.impl.model.file.FileDataModel.processLine(FileDataModel.java:412)
at org.apache.mahout.cf.taste.impl.model.file.FileDataModel.processFile(FileDataModel.java:363)
at org.apache.mahout.cf.taste.impl.model.file.FileDataModel.buildModel(FileDataModel.java:259)
at org.apache.mahout.cf.taste.impl.model.file.FileDataModel.reload(FileDataModel.java:231)
at org.apache.mahout.cf.taste.impl.model.file.FileDataModel.<init>(FileDataModel.java:221)
at org.apache.mahout.cf.taste.impl.model.file.FileDataModel.<init>(FileDataModel.java:169)
at org.apache.mahout.cf.taste.impl.model.file.FileDataModel.<init>(FileDataModel.java:149)
at action.recommend.Commender.ItemBasedRecommend(Commender.java:68)

at action.recommend.Commender.main(Commender.java:30)


FIND

debug发现


果然有一行用户id为空,其紧跟的图书id不为空。

打开数据文件,ctrl+F,查找读书id,450976834041

锁定位置,果然有几行的第一个数据缺失了。


HANDLE

在kettle的transform新加一个组件,过滤掉空记录,当然也可以设置条件替换为一个固定值。毕竟是Test,先跑起来吧。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值