问题描述:现网一程序每小时上传若干文件(原文件)到另一台服务器(简称38机器)上(目标文件),今早9点报某一文件上传失败
解决问题:
1、首先,查看事故现场,即查看日志,日志只显示上传失败,没有其他有用的信息(这个问题有点特殊,和平时异常不太一样,平时异常都会显示详细的信息,比如文件找不到、解析错误、没有权限等等)
2、接着,查看原文件是否存在,经核查,原文件确实存在,没有问题
3、查看目标文件,发现目标文件竟然存在。有点疑惑,上传失败了怎么会有文件?!问其他组的同事,同事解释:其他程序进行了平滑处理,即自动生成了这个文件
4、问题还是没有解决,为什么上传失败?不是应该覆盖目标文件?找运维同事帮忙登上38机器,看看什么情况。进入目标文件目录,发现这个目标文件的权限居然是root权限(搞不明白为啥用root?!有点坑!不应该用的是公用的账号?!)!真相大白,因为现网负责上传文件的程序账号是普通账号,故没有权限进行覆盖,就报出了上传失败