出现这个报错的原因是因为当flume监听并采集文件内容时,该文件内容还在变化(被其他进程修改)就会导致报错
今天尝试将本地的一个log文件通过flume监听文件夹的形式上传到hdfs上时出现此错误。
我的操作是直接将文件通过rz命令上传到被监听的文件夹,这样就会导致一边监听,一边还在追加文件内容,之后我尝试了在flume配置文件中添加:
a1.sources.s1.ignorePattern = ^(.)*\\.tmp$
即通过正则匹配的形式,不让flume收集.tmp为后缀的内容,发现还是不行。
最终解决方案:
将文件放到一个不被监听的文件下,之后通过mv命令或scp命令将文件移动到被监听文件夹下,问题即解决(最好用mv命令,scp偶尔会出现File has been modified since being read的问题)