下面可以在Linux系统中打开一个命令行终端,执行如下Shell命令,运行Spark_Recommend.jar程序:
上面命令中,为Spark_Recommend程序提供了5个参数,其中,第1个参数“/input_spark”是HDFS文件系统中的目录,该目录下包含了两个文件movies.dat和ratings.dat(如果不存在该目录和文件,请使用HDFS命令创建目录并上传数据文件)。第2个参数是personalRatings.dat文件路径(这里是一个放在Linux本地文件系统中的文件,没有存放在HDFS中),第3、4和5个参数分别是隐语义因子个数、ALS正则化参数、迭代次数。
执行上面命令以后,如果运行成功,可以得到如下所示推荐结果。
需要注意的是,ALS(最小交替二乘法)算法里面包含了随机的过程,因此,每次运行Spark_Recommend程序,得到的推荐结果不会完全相同。
# 终端运行结果
注:
/usr/local/spark/bin/spark-submit --class recommend.MovieLensALS ~/IdeaProjects/Film_Recommend_Dataframe/out/artifacts/Film_Recommend_Dataframe_jar/Film_Recommend_Dataframe.jar /input_spark 1