通过查看失败task的counter发现没有input数据 再看task的log找到具体的数据片,发现数据中某一行有8000w个字符,删除改行就好了 初步估计是标准输入输出有长度限制或者hadoop的streaming有限制,暂时未确定