推荐系统简介
互联网的出现和普及给用户带来了大量的信息,满足了用户在信息时代对信息的需求,但随着网络的迅速发展而带来的网上信息量的大幅增长,使得用户在面对大量信息时无法从中获得对自己真正有用的那部分信息,对信息的使用效率反而降低了,这就是所谓的信息超载问题。
解决信息超载问题一个非常有潜力的办法是推荐系统,它是根据用户的信息需求、兴趣等,将用户感兴趣的信息、产品等推荐给用户的个性化信息推荐系统。和搜索引擎相比推荐系统通过研究用户的兴趣偏好,进行个性化计算,由系统发现用户的兴趣点,从而引导用户发现自己的信息需求。一个好的推荐系统不仅能为用户提供 个性化的服务,还能和用户之间建立密切关系,让用户对推荐产生依赖。
推荐系统现已广泛应用于很多领域,其中最典型并具有良好的发展和应用前景的领域就是电子商务领域。同时学术界对推荐系统的研究热度一直很高,逐步形成了一门独立的学科。
Mahout 是 Apache Software Foundation(ASF) 旗下的一个开源项目,提供一些可扩展的机器学习领域经典算法的实现,旨在帮助开发人员更加方便快捷地创建智能应用程序。Mahout包含许多实现,包括聚类、分类、推荐过滤、频繁子项挖掘。此外,通过使用 Apache Hadoop 库,Mahout 可以有效地扩展到云中。
Mahout 是基于Hadoop的机器学习和数据挖掘的一个分布式框架。Mahout用MapReduce实现了部分数据挖掘算法,解决了并行挖掘的问题。
入门书 :《推荐系统实践》项亮
使用工具:
apache-mahout
官方下载地址: http://mahout.apache.org/
idea
官方下载地址:https://www.jetbrains.com/idea/download/#section=linux
百度网盘地址:https://pan.baidu.com/s/164Dqg3lXEZy-LKCPUray1g
VMware Workstation 下载地址:
百度网盘地址:https://pan.baidu.com/s/1hxLeToDXZ63UiMnZNBOE_g
jdk7
官方下载地址:https://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html
百度网盘地址:https://pan.baidu.com/s/14lg3Nl_bbnN8mmxTvzVEsA
hadoop
官方下载地址:https://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html
百度网盘地址:https://pan.baidu.com/s/14lg3Nl_bbnN8mmxTvzVEsA
CentOS
官方下载地址:https://www.centos.org/
百度网盘地址:https://pan.baidu.com/s/1Du-t5g_uCGZ4clbXv5Ejcg