1、背景:样本量在2W左右,特征数在1W左右;利用spark 的pca 特征时,总报错 java.lang.OutOfMemoryError: Java heap space;
2、解决方法:
spark.driver.maxResultSize", "40g" 产生的结果大于默认的1024M,需要的话设置大点;
--driver-memory 100g (大点)
1、背景:样本量在2W左右,特征数在1W左右;利用spark 的pca 特征时,总报错 java.lang.OutOfMemoryError: Java heap space;
2、解决方法:
spark.driver.maxResultSize", "40g" 产生的结果大于默认的1024M,需要的话设置大点;
--driver-memory 100g (大点)