1.项目介绍:
随着互联网逐渐在社会普及,信息爆炸现象日益明显,各行业各领域用户不断为互联网提供信息输送,使得互联网成为一个无所不包、无所不含的信息汇聚体,而互联网用户又很难在浩如烟海的信息海洋中快速找寻到自己需要和感兴趣的信息。例如求职者想要在诸多的职位中找到理想的工作,公司想在茫茫人海中找到合适的人才,大量的无用信息使得这件事成为一件难事。为了解决这一问题,我们需要一个推荐系统,为求职者筛选可能感兴趣的职位,为公司推荐较为合适的人才。
本文基于模型(用户,物品)的协同过滤算法,通过收集大量求职者对就职意向的评分,来计算每个求职者之间的相似度,选出相似度最高的一些用户之前选择过的职位且评分较高的并以此作为推荐结果。为公司推荐用户可以把职位看成用户,用户看成职位,根据职位的相似度作为相应的推荐。
项目流程:
集群资源规划设计:
| qy01 | qy02 | qy03 |
HDFS | NameNode DataNode | DataNode | DataNode |
YARN | ResourceManager NodeManager | NodeManager | NodeManager |
Zookeeper | Zookeeper | Zookeeper | Zookeeper |
Kafka | Kafka | Kafka | Kafka |
Flume | Flume | Flume | Flume |
Spark | Spark |
|
|
Hive | Hive |
|
|
Mysql | Mysql |
|
|
项目代码截图:
界面展示: