在用spark-submit提交程序时,会打印很多类似图片所示的日志信息,它们会把想要的结果给淹没,所以要想法去除控制台的日志信息。
解决办法:程序中设置日志级别,然后将运行结果保存在nohup.out文件中
//程序中导入 import org.apache.log4j.{Level, Logger} //下面两行代码放在main函数里 Logger.getLogger("org.apache.spark").setLevel(Level.WARN) Logger.getLogger("org.apache.spark.sql").setLevel(Level.WARN)
关于setLevel()中的参数:
1.DEBUG Level指出细粒度信息事件对调试应用程序是非常有帮助的,一般认为比较重要的方法执行需要详细查看运行情况的则开启debug。
2.INFO level表明消息在粗粒度级别上突出强调应用程序的运行过程,只需要了解该方法是否运行的可以使用INFO
3.WARN level表明会出现潜在错误的情形。
4.ERROR level指出虽然发生错误事件,但仍然不影响系统的继续