基于MOGO用户画像的商品推荐系统的设计与实现

摘要: 随着网络技术的发展,商品推荐系统也迅速发展,在线购物平台成为人们听商品的首选。但商品推荐系统也面临一些问题,数据规模庞大造成的数据存储混乱、计算效率低下、冷启动和数据稀疏性等问题。针对以上问题,本文首先对商品推荐系统的国内外发展现状和相关理论进行了总结;然后对推荐系统进行了分析与研究,设计了基于用户画像的混合推荐算法;其次设计了商品推荐系统的整体架构,对各个功能模块进行了设计与实现;最后对商品推荐系统进行了测试,验证了推荐系统的可行性和稳定性。

本文主要研究内容如下:

(1)从实际需求出发,设计了一个能够处理大规模数据的个性化商品播放信息推荐系统,包括个性化推荐引擎,用户相关模块和商品评价模块等主要部分。将在线推荐和离线数据分析与计算相结合,高效快捷的提供符合其个人实际情况的商品播放信息。  

(2)设计并实现了商品推荐系统。对数据进行采集与传输。搭建了商品数据仓库,对数据进行分层处理和存储。然后对数据进行预处理,利于推荐模型的计算。其次在推荐算法的基础上,结合Mogo分布式框架,完成了推荐模块,实现了商品推荐系统。最后经过功能测试与非功能测试,体现了商品推荐系统高效性、可扩展性和稳定性,能够满足用户的个性化商品需求。

关键词:Mogo,java,用户画像,商品推荐系统

Design and Implementation of Product Recommendation System Based on MOGO User Portrait

Abstract: With the development of network technology, product recommendation systems have also developed rapidly, and online shopping platforms have become the first choice for people to listen to products. However, commodity recommendation systems also face some problems, such as data storage chaos, computational inefficiency, cold start, and data sparsity caused by the large scale of data. In response to the above issues, this article first summarizes the development status and relevant theories of commodity recommendation systems at home and abroad; Then, the recommendation system is analyzed and studied, and a hybrid recommendation algorithm based on collaborative filtering is designed; Secondly, the overall architecture of the product recommendation system is designed, and each functional module is designed and implemented; Finally, a product recommendation system is tested to verify the feasibility and stability of the recommendation system.

The main research contents of this article are as follows:

(1) Based on practical needs, a personalized product playback information recommendation system capable of handling large-scale data is designed, including a personalized recommendation engine, user related modules, and product evaluation modules. Combining online recommendation and offline data analysis with computing, it efficiently and quickly provides product playback information that meets their personal needs.

(2) Design and implement a product recommendation system. Collect and transmit data. A commodity data warehouse was built to process and store the data hierarchically. Then pre process the data to facilitate the calculation of the recommended model. Secondly, based on the recommendation algorithm and combined with the Mogo distributed framework, the recommendation module is completed and the product recommendation system is implemented. Finally, through functional and non functional testing, it shows that the product recommendation system is efficient, scalable, and stable, and can meet the personalized product needs of users.

Key words:Mogo, java, collaborative filtering, product recommendation system

目  录

1 绪论

1.1选题的背景与意义

1.2国内外现状

1.2.1 国内现状

1.2.2 国外现状

1.3 拟研究的内容

1.4相关技术介绍

1.4.1 Mogo技术

1.4.2 用户画像技术介绍

1.4.3  java技术

1.4.4 用户画像算法

1.4.5基于用户的用户画像算法

1.4.6 基于物品的用户画像算法

2 需求分析

2.1 可行性分析

2.1.1经济可行性

2.1.2 技术可行性

2.1.3 操作可行性

2.2 功能需求分析

2.3 非功能性分析

3 软件设计

3.1 系统总体设计

3.2 系统详细设计

3.2.1 个性化商品推荐系统设计

3.2.2 Mogoc程序设计

4 编码

4.1 开发环境与配置

4.1.1 开发环境

4.2 系统功能模块实现

4.2.1登录认证

4.2.2商品详情信息管理功能

4.2.3用户画像管理功能

4.3 本章小结

5 总结与展望

6.1 总结

6.2 展望

参考文献

致  谢

1 绪论

1.1选题的背景与意义

随着网络的不断发展和流行,互联网上的信息量急剧增加,用户很容易迷失在信息的海洋中。网络商品播放信息,作为互联网信息的一种,广泛充斥在互联网中。而且,商品播放信息网站林林总总、真假难辨。面对海量信息,信息检索和信息过滤是当前两种主要的解决方案。其中,信息检索的结果是大众化的,只要输入的关键词一样,搜索结果就相同,并且搜索结果的数据量可能仍然很大。而信息过滤则能有效的弥补信息检索的不足,通过个性化定制的方法进一步提升用户体验度。常用的信息过滤方式为个性化推荐。因此,本文在商品播放信息的处理中充分结合信息检索和信息过滤这两种方式,为求职者尽可能简洁高效的提供真实有用的信息。

总而言之从上述问题可以看出目前互联网商品播放信息平台信息缺乏整合用户在冗杂的商品播放信息中难以筛选出有效的信息本论文拟初步研究开发出一套完整的基于Mogo商品推荐系统本系统实现了移动用户的推荐就业功能。这样用户在使用本平台时只需一次注册操作即可浏览各平台发布的商品播放信息。

1.2国内外现状

1.2.1 国内现状

近年来,国内外各式各样的在线购物服务不断涌现。Jing.fm 提供基于用户上下文的商品推荐,用户只需要选择所处的情境,比如“轻松”、“伤感”、“寂寞”等,就可以听到与情境相符的商品来。京东商城的在线视频直播,让用户不仅可以收听浏览商品信息,还可以参与到商品发布去,吸引了不少的用户。基于用户上下文的商品推荐在近几年得到了较快的发展,国内著名在线购物电台豆周电台也引入了该方法。而像京东商城这样采取视频直播方式,却是商品网站的一种新颖方式,它不仅可以让无法看到真正网购的人们在这个平台上以直播的方式看到喜欢的产品,还可以给用户一个施展才华的平台,让用户更大程度地参与到商品中去。虽然淘宝京东的出现并没有给商品推荐的发展作出多大的贡献,但作为商品网站的一个新形式,定会给在线购物产生一定的影响。

1.2.2 国外现状

基于内容的过滤源于信息检索领域,最初用于从文本中提取有用信息,现在用到了一些比较复杂的领域,比如音频、图像、视频检索,这得益于信息提取和机器学习方面的进展。基于内容的推荐提取出物品属性信息,根据用户偏好,预测哪些物品会受到用户青睐。这个方法不依赖于其他用户的评分记录,只需要物品信息。提取物品属性信息可以请相关领域的专家作标注,也可以利用软件自动分析,甚至可以使用由用户标记的社会化标签。基于内容的商品推荐,就是把内容上与用户原喜欢的商品相近的商品推荐给该客户,首先要提取商品特征信息,并计算相似度。在这方面投入力度最大的当属Pandora, Last.fm. 腾讯商品等也积极参与其中。

关联规则起源于数据挖掘领域,用来发现大量数据中的频繁项集。推荐规则是其重要组成部分,几乎每个基于关联规则的推荐系统都有不同的规则。

用户画像可以分为基于用户的用户画像算法(User-based CllaborativeRecommendation, User-CF)、基于物品的用户画像算法( Item-based CollaborativeRcommendation, Item-CF)、基于模型的用户画像算法(Model-based CllaborativeRecommendation)。基于用户的用户画像算法是推荐系统中最早的算法,1992 年诞生的第一个推荐系统即是使用该算法。基于物品的用户画像 算法由亚马逊提出,亚马逊用这个算法为用户推荐和他们之前喜欢的物品相似的物品,但这里讲的相似和基于内容的推荐不同,并不是物品内容的相似,而是通过分析用户对物品产生的行为记录来计算物品之间的相似度,比如,喜欢物品A的用户大多数都喜欢物品B,那么可以认为A和B相似。基于模型的用户画像包括隐语义模型(Latent Factor Model)、 基于图的模型(Graph-based Model)、 贝叶斯网络模型( Bayesian Network Model)等,在一个数据样本 上对这些模型进行训练,得到需要的预测模型,然后进行评价预测。

1.3 拟研究的内容

本论文所设计的基于Mogo商品推荐系统的最核心功能是对海量商品播放信息的精准推荐,并将大数据计算分析的结果以科技大屏可视化形式展出使得用户能够非常直观的获取到当下最匹配用户需求的行业商品播放信息。

基于Mogo商品推荐系统的设计与实现;然后就是运用以前学过的Mogojava语言,数据库(数据库选择mysql),Spark等相关知识,在linux系统环境下运用Map和Reduce框架进行处理数据,然后用Java语言编写好前端并且连接上数据库。然后在设计系统的时候要有一个具体的需求,根据系统的具体要求进行测试,系统要从用户需求,系统页面,功能是否正常,系统是否安全,是否可靠,运行长时间是否会奔溃,在移动端的各个系统中运行正常,系统的移植性是否正常,系统是否操作简单,是否快捷,是否为大众都能简单使用,软件的后台服务器是否强大,最大的用户负载量是多少,最适宜的负载量是多少等情况进行测试。最后系统开发完毕后,要对前期的研究工作进行全方面的思考,分析,归纳和总结。

1.4相关技术介绍

1.4.1 Mogo技术

Mogo 是一个轻量级的基于浏览器的日志分析和查询平台,可以配合 ClickHouse、MySQL 等多种数据源使用。基于Mogo商品推荐系统中主要是对商品播放信息数据集通过使用代码进行数据清洗,然后再导入Mogo HDFS中分布存储。在通过Mogo程序并行计算进行数据抽取,多维分析,查询统计等操作来完成数据分析部分。

1.4.2 用户画像技术介绍

互联网的出现和普及给用户带来了大量的信息,满足了用户在信息时代对信息的需求,但随着网络的迅速发展而带来的网上信息量的大幅增长,使得用户在面对大量信息时无法从中获得对自己真正有用的那部分信息,对信息的使用效率反而降低了,这就是所谓的 信息超载(informationoverload)问题。

解决信息超载问题一个非常有潜力的办法是 推荐系统,它是根据用户的信息需求、兴趣等,将用户感兴趣的信息、产品等推荐给用户的个性化信息推荐系统。和搜索引擎相比推荐系统通过研究用户的兴趣偏好,进行个性化计算,由系统发现用户的兴趣点,从而引导用户发现自己的信息需求。一个好的推荐系统不仅能为用户提供个性化的服务,还能和用户之间建立密切关系,让用户对推荐产生依赖。

推荐系统现已广泛应用于很多领域,其中最典型并具有良好的发展和应用前景的领域就是电子商务领域。同时学术界对推荐系统的研究热度一直很高,逐步形成了一门独立的学科。

推荐系统有3个重要的模块:用户建模模块、推荐对象建模模块、推荐算法模块。通用的推荐系统模型流程如图1。推荐系统把用户模型中兴趣需求信息和推荐对象模型中的特征信息匹配,同时使用相应的推荐算法进行计算筛选,找到用户可能感兴趣的推荐对象,然后推荐给用户。

推荐系统整个过程分为几个阶段,在这里把他分为四个阶段:用户画像、match(召回)、rank(排序)、adapter(后处理)。其中match和rank是两个关键任务,也是推荐方面优化的主要方向。

1.用户画像,这部分主要是为了对用户建模,根据用户的历史行为挖掘用户的偏好数据(偏好目的地、Item、Poi、类目、类型等等),挖掘用户的属性信息,为后面几个阶段服务(通过用户的偏好信息去召回推荐的商品列表,在adapter阶段作一些后处理等);

2.match,这部分主要是为了召回用户可能感兴趣的推荐列表,因为在实际应用场景中,商品的数量往往很多(例如新闻、商品、电影、商品等,亿级别的数量),直接用一个模型对所有商品打分往往不太现实。可以认为match部分是一个粗排序的阶段,我们希望在这个阶段从广大的商品池子中召回出用户可能感兴趣的所有商品,因此需要从多个不同的角度去召回(根据用户偏好的目的地召回对应目的地下的热门Item、根据偏好的类目召回对应类目下的热门Item、根据用户偏好的Item召回相似的Item等等)。

3.rank这部分是在match过后对召回的商品进行一个精确的排序,通过机器学习模型对商品打分,返回分数靠前的n个商品作为最终的推荐列表。

4.adapter 这部分就是对推荐列表进行预处理了,例如曝光过滤(控制商品的曝光次数,避免商品持续曝光导致用户的疲劳度)、打散(为了增加推荐的丰富性,对推荐结果进行类目、目的地的多样性化)、黑名单过滤等等。

1.4.3  java技术

Java是一种编程语言,被特意设计用于互联网的分布式环境。Java具有类似于C++语言的“形式和感觉”,但它要比C++语言更易于使用,而且在编程时彻底采用了一种“以对象为导向”的方式。Java是Sun微系统公司在1995年推出的,推出之后马上给互联网的交互式应用带来了新面貌。最常用的两种互联网浏览器软件中都包括一个Java虚拟机。几乎所有的操作系统中都增添了Java编译程序。

Java平台Java虚拟机(Java Virtual Machine)和Java 应用编程接口(Application Programming Interface、简称API)构成。Java 应用编程接口为Java应用提供了一个独立于操作系统的标准接口,可分为基本部分和扩展部分。在硬件或操作系统平台上安装一个Java平台之后,Java应用程序就可运行。Java平台已经嵌入了几乎所有的操作系统。这样Java程序可以只编译一次,就可以在各种系统中运行。Java应用编程接口已经从1.1x版发展到1.2版。常用的Java平台基于Java1.8,最近版本为Java19。

1.4.4 用户画像算法

用户画像推荐算法是诞生最早,并且较为著名的推荐算法。主要的功能是预测和推荐。算法通过对用户历史行为数据的挖掘发现用户的偏好,基于不同的偏好对用户进行群组划分并推荐品味相似的商品。用户画像算法分为两类,分别是基于用户的用户画像算法(user-based collaboratIve filtering),和基于物品的用户画像算法(item-based collaborative filtering)。简单的说就是:人以类聚,物以群分。下面我们将分别说明这两类推荐算法的原理和实现方法。

1.4.5基于用户的用户画像算法

基于用户的用户画像算法是通过用户的历史行为数据发现用户对商品或内容的喜欢(如商品购买,收藏,内容评论或分享),并对这些喜好进行度量和打分。根据不同用户对相同商品或内容的态度和偏好程度计算用户之间的关系。在有相同喜好的用户间进行商品推荐。简单的说就是如果A,B两个用户都购买了x,y,z三本图书,并且给出了5星的好评。那么A和B就属于同一类用户。可以将A看过的图书w也推荐给用户B。

1.4.6 基于物品的用户画像算法

基于物品的用户画像算法与基于用户的用户画像算法很像,将商品和用户互换。通过计算不同用户对不同物品的评分获得物品间的关系。基于物品间的关系对用户进行相似物品的推荐。这里的评分代表用户对商品的态度和偏好。简单来说就是如果用户A同时购买了商品1和商品2,那么说明商品1和商品2的相关度较高。当用户B也购买了商品1时,可以推断他也有购买商品2的需求。

2 需求分析

    1. 可行性分析

商品推荐系统是管理员对电影信息和用户信息进行管理的系统,也是用户查看、订票的系统,通过网络在线购物的方式,管理员可以更轻松准确地完成工作,用户也可以省去很多不必要的购票麻烦,因此,商品推荐系统给管理员和用户都提供了一个的方便快捷的购票卖票的渠道。此系统功能模块分析就是对系统中的每个功能进行分类,并进行理性分析的过程。分析是为了开发者可以更好地理解题目,更准确完成项目内容,所以,进行功能模块分析是必不可少的一个步骤。

2.1.1经济可行性

实际操作中使用的软件均为绿色免费软件,可以在网站上自主下载并使用,甚至有些软件是免安装的,使用起来更加方便。资料的输入和备份都是免费的。用户及管理员都可以免费使用商品推荐系统,除了购买电影票,其他操作不会有多余的费用产生,经济效益较高。

2.1.2 技术可行性

商品推荐系统使用的是JSP技术,是一种广泛运用的网页设计技术,操作简单,跨平台性好,安全性高。使用的开发工具简单,一台电脑即可,搭配使用的数据库MySQL和服务器Tomcat都是免费下载的,不会产生其他开发费用,并且,根据不同的需求可以下载到同类的更合适的软件进行替代使用。

2.1.3 操作可行性

商品推荐系统的建立方便了管理员对信息的管理,为用户提供了快捷的方法去购票看电影。在信息化时代的现在,对管理员和用户都带来了极大的好处。无国家限制,无地方限制。该系统没有抄袭,没有侵权。故,可行。

    1. 功能需求分析

根据以上的需求分析得知,可以将此商品推荐系统划分为以下的两大功能,并对其模块的划分和功能进行描述。

用户登录:实现用户登录功能,通过登录验证的用户可以进入商品推荐系统实现网上购物的一系列活动。

用户注册:第一次网上购物的用户,需填写个人信息进行注册。

    1. 非功能性分析

根据题目及时间安排,制定了详细合理的设计进度的计划、有经验丰富的老师指导、具有良好的合作关系、有大量的参考资料的帮助,可以确保此毕业设计按时的顺利完成。


3 软件设计

3.1 系统总体设计

(1)明确目的

在设计基于Mogo的用户商品推荐系统平台初期需要了解如何获取商品播放信息原始数据是非常基础也是关键的一步。要了解大数据分析平台期望达到什么样的运营效果,从而在标签体系构建时对数据深度、广度及时效性方面作出规划,确保底层设计科学合理。

(2)数据采集

只有建立在客观真实的数据基础上,大数据计算分析的结果才有效。在采集数据时,需要考虑多种维度平台前台后台数据收集等方式获得。

(3)数据清洗

就对于各大商品网站或者APP平台如QQ商品网易月商品采集到的商品数据而言,可能存在非目标数据、无效数据及虚假数据,因而需要过滤原始数据,去除一些无用的信息以及脏数据,便于后续的处理。

(4)特征工程

特征工程能够将原始数据转化为特征,是一些转化与结构化的工作。在这个步骤中,需要剔除数据中的异常值并将数据标准化。

(5)数据计算

 在这一步我们将得到的数据存储到大数据分析平台,通过开发Mogo程序对原始数据进行计算,将不同维度的结果存储到Mysql中。

(6)数据展示

 分析结果可以通过大数据后台展示到前端界面,对于普通用户而言,只需要登录到该后台系统,就可以获取到就业数据分析后的计算结果,从而了解行业的就业情况,对于求职者而言可以极大地提高效率。

  1. 商品推荐

搭建商品数据仓库,对数据进行分层处理和存储。然后对数据进行预处理,利于推荐模型的计算。其次在改进算法的基础上,结合Mogo分布式框架,完成了推荐模块,实现了商品推荐系统。最后经过功能测试与非功能测试,体现了商品推荐系统高效性、可扩展性和稳定性,能够满足用户的个性化商品需求

3.2 系统详细设计

本文做了个性化推荐系统,后端使用个性化推荐算法构造,前端使用Spring+SSM框架搭建了个性化商品推荐系统。系统数据库使用了关系型数据库MySQL和大数据数据库。前端收集过用户行为数据后传到后端使用基于用户的用户画像算法来推荐出用户可能喜欢的商品。设计主要完成了从网易云商品门户网站上爬取数据(商品信息,歌手信息等),并在获取数据后对数据进行清洗过滤等操作后保证了数据的有效性,将爬取到的六千多条数据保存到数据库后,采用基于用户的用户画像算法推荐用户可能喜欢的商品

在任何信息系统当中有价值的数据都是必不可少的重要部分如何通过手上的资源获取得到有价值的数据便是开发系统首先需要考虑的问题根据系统的功能设计数据获取和处理的流程以及其实现方法都已经基本上确定获取和处理流程。

由于大数据开发需要搭建集群环境,而集群环境一般都要求位于同一局域网内的多台机器,由于多台机器从购买和维护的成本的角度上而言都是比较昂贵的,这对于普通开发者而言是一笔不小的费用,因此本文拟使用Vmware虚拟机搭建大数据集群环境。
      Vmware是一款功能强大的桌面虚拟计算机软件,它提供用户可在单一的桌面同时运行不同的操作系统,同时提供用户开发、测试、部署新的应用程序的最佳解决方案。Vmware具有不同系统内核的多个版本的工具包镜像,如Ubuntu,CentOS等,本文选择CentOS版本的镜像,CentOS是免费的、开源的、可以重新分发的开源操作系统,是Linux发行版之一。而Mogo集群即HDFS集群和YARN集群又依赖于Linux内核,因此选择CentOS版本的镜像最为合适,这样即可在独立的服务器上实现大数据集群的部署。

3.2.1 个性化商品推荐系统设计

基于深度学习的商品推荐系统旨在以个性化商品推荐模型为基础,使用B/S架构的形式实现。个性化推荐模型使用了 随机梯度下降(SGD)、 K近邻分类算法(KNN)、用户画像等传统机器学习领域算法进行商品推荐的,同时使用了类似于Word2vec的词袋模型和词向量模型来对歌词进行文本处理,构建了异构文本网络,来标识用户的商品偏好,然后在此基础上引入了一个Java方面深度学习库deepLearning4j来实现对商品特征提取,对商品进行标签化,分为古典、流行等类别。可参考来进行混合推荐的。在本系统中,用户可以浏览商品,还可以收藏商品,同时还能为所喜爱的商品点赞,同时还可以进行登录和注册。管理员除了可以实现普通用户所实现的功能外,还可以进行商品、评论、用户的管理。系统通过隐式收集用户操作记录向用户推荐个性化的商品,与此同时,该系统还具有排行榜、热歌推荐等普通商品网站所具有的功能,其中排行榜分为日榜和月榜,热歌推荐是根据当天用户点击量最高的50个商品进行推荐给用户的。

3.2.2 Mogoc程序设计

原始的商品播放信息数据一般信息较为冗杂且很难看出规律因此我们需要将数据存储在HDFS上数据在多台机器上保存了n份保证了原始数据的高可用然后通过Mogo框架开发程序将海量的原始数据计算过程分成一个个的job提交到yarn上管理执行

图3-1商品推荐系统框架

4 编码

基于Mogo商品推荐系统可视化系统的基本业务功能是采用 Java语言实现的,  数据存储采用关系型数据库 Mysql。 本文的第四章将详细介绍后台系统的实现部分,包括详细阐述了系统功能模块的具体实现,并展示说明了部分模块的功能界面。

4.1 开发环境与配置

4.1.1 开发环境

可视化后台系统设计基于 B/S 架构,其中服务器包括应用服务器和数据库服务器。 这种架构模式,使用户只需要在有网络的地方即可通过浏览器访问,而不需要再安装客户端软件,交互性更强。基于Mogo商品推荐系统可视化系统后台使用IDEA 集成开发工具。而系统运行配置时,选择应用 Tomcat 来部署 Web 服务器来保障平台的正常运行, Tomcat 是Apache的核心项目,其技术先进、性能稳定并且开源免费, 因而被普遍应用 。 本系统的主要开发环境以及开发工具如表 4-1 所示。

表4-1 系统开发环境和工具

项目

系统环境及版本

硬件环境

Windows 64 位操作系统

JDK

Jdk1.8

Web服务器

Tomcat7

数据库

MySql

开发工具

IDEA

项目架构

Mogo

4.2 系统功能模块实现

4.2.1登录认证

用户登录时需要在登录界面输入用户名、 密码进行身份认证, 要求必须是合法的用户才可以访问系统。 Shiro 使用 FormAuthenticationFilter 类进行表单认证、校验。其配置文件中配置了相应的 Realm类, 当用户登录系统进行身份认证和权限控制时,Shiro 会在该类中从数据库获取到用户信息及其具有的权限信息, 并且比较用户输入的账号是否存在或者输入的密码与数据源中的密码是否匹配。 在实际实现中, 程序中自定义了 MyRealm 类继承 Realm 类, 并重写了 doGetAuthenticationInfo( )认证方法和 doGetAuthorizationInfo( )授权方法。具体流程如时序图如4-2所示。

图4-1登录认证流程图

基于Mogo商品推荐系统系统的架构图如下图所4-3所示:

图4-2首页

4.2.2商品详情信息管理功能

商品详情信息管理功能是对商品播放信息进行查询,删除等操作的功能集合,商品播放信息管理功能使用到了商品播放信息表t_shangpin, 商品播放信息表。

图4-3商品详情

4.2.3用户画像管理功能

基于Mogo的商品推荐系统旨在以个性化商品推荐模型为基础,使用B/S架构的形式实现。个性化推荐模型使用了 随机梯度下降(SGD)、 K近邻分类算法(KNN)、用户画像等传统机器学习领域算法进行商品推荐的,同时使用了类似于Word2vec的词袋模型和词向量模型来对歌词进行文本处理,构建了异构文本网络,来标识用户的商品偏好,然后在此基础上引入了一个Java方面深度学习库deepLearning4j来实现对商品特征提取,对商品进行标签化,分为古典、流行等类别。可参考来进行混合推荐的。

图4-4 用户管理界面

在本系统中,用户可以浏览商品,还可以收藏商品,同时还能为所喜爱的商品点赞,同时还可以进行登录和注册。管理员除了可以实现普通用户所实现的功能外,还可以进行商品、评论、用户的管理。系统通过隐式收集用户操作记录向用户推荐个性化的商品,与此同时,该系统还具有排行榜、热歌推荐等普通商品网站所具有的功能,其中排行榜分为日榜和月榜,热歌推荐是根据当天用户点击量最高的50个商品进行推荐给用户的。

4.3 本章小结

本章主要分析了基于Mogo的商品推荐系统开发过程中使用到的技术和具体的实现步骤,这其中主要介绍后台系统的搭建环境和开发步骤,包括程序中的一些数据库配置等。本章我们已完成商品播放信息的可视化系统的后台开发工作,将会给用户带来一定的便利,同时本系统还为用户提供个人信息管理,就业数据查询等功能,这样做便使得该系统成为功能相对完整,业务逻辑清晰。

5 总结与展望

6.1 总结 

本文重点阐述和研究了基于用户行为分析的个性化推荐的相关理论和算法,设计和实现了一个个性化商品推荐系统,该系统可以利用用户的收听记录等隐反馈数据实现推荐,最后以Last.fm 商品社交网络的1K User数据集为数据基础对系统进行了测试,现将本文的主要工作总结如下:

概述了个性化推荐领域的基本理论、算法和研究热点,对基于内容、基于关联规则和用户画像的相关算法和理论的进行了阐述,分析了它们各自的应用场景。结合商品推荐的特殊性和相关理论、技术的发展,介绍了个性化商品推荐领域的研究新热点。

6.2 展望 

(1)学习研究推荐算法,研究用户行为数据的利用,提高推荐效能。本文只用到了众多推荐算法中的两个,很多优秀的推荐算法还没有得到应用,大量用户行为数据也未得到利用。基于内容的推荐和基于关联规则的推荐都可以应用于商品推荐。用户收藏、分享等也是表达偏好的方式,有的用户对歌手和曲风都有明显的偏好,隐式反馈数据的有效利用能提高系统性能,另外,利用用户社会网络数据提升算法效能也是一个方向。以后在学习中不仅要对单个算法深入研究,还要研究算法的融合,用多种算法为用户作出有价值的推荐。

(2)对于冷启动、系统扩展性等问题进行进一步的考虑。 虽有研究人员报告称,只要用户喜欢你的产品,就会不断贡献新的数据,从而不必关心冷启动。但实际系统中要让用户获得较好的体验效果,我们还是应该认真对待这个问题。对于扩展性,可以采用分布式计算的方法来加以解决。


参考文献

[1] 姜建武, 李景文, 陆妍玲,等. 基于大数据的信息智能推送方法[J]. 微型机与应用, 2016(23):86-89.

[2] 张钧. 基于大数据的就业知识发现服务研究[J]. 图书与情报, 2017, 000(006):60-63.

[3] 郝胜宇, 陈静仁. 大数据时代用户信息助力企业实现精准化营销[J]. 中国集体经济, 2016, 000(004):61-62.

[4] 李映坤. 大数据背景下数据的统计方法实践研究[D]. 2016.

[5] 余孟杰. 产品研发中数据的数据模建——从具象到抽象[J]. 设计艺术研究, 2014, 4(006):60-64.

[6] 雷兵, 常知刚, 钟镇. 基于网络店铺订单数据的大数据平台构建研究[J]. 河南工业大学学报(社会科学版), 2019, v.15;No.61(01):58-65.

[7] 牛温佳. 用户网络行为画像[M]. 电子工业出版社, 2016.

[8] 张慷. 商品播放信息在大数据平台的实现方案[J]. 信息通信, 2014(02):266-267.

[9] wikipedia. Mel-frequency cepstrum.htp:/n.wikipedia. org/wiki/Mel-frequency cepstrum/[OL]. 2014.03

[10]邹益、基于内容的音频检索研究[D].南京:南京理工大学. 2007

[11]庄严,于凤芹,结合节拍语义和MFCC声学特征的商品流派分类[J].计算机工程与应用2013.08

[12] Rakesh Agrawal, Tomasz Imielinski, Arun Swami. Mining asciation nules between sets ofitems in large databases[C]. 1993 ACM SIGMOD Conference. 1993.

[13] 王静基于关联规则的图书销售网站个性化推荐系统设计与实现[D].成都:电子科技大学.2012.03

[14]邓先箴.基于关联规则的推荐算法研究与应用[D]上海:华东师范大学2009.10

[15]王国霞,刘贺平,个性化推荐系统综述[].计算机工程与应用,2012.48(7). 6-76.

[16] Toby Segaran著,莫映,王开福译.集体智慧编程[M].电子工业出版社.2009.01

[17] Francesco Ricci, Lior Rokaach, Bracha Shapira, et al. Recommender Systems Handbook[M].Springer. 2011

[18] 付超群.Openslopeone. http://code.google.com/ p/openslopeone/[OL].2009.02

[19]项亮.推荐系统实践[M].人民邮电出版社. 2012.06

[20] Yehuda Koren, Robert Bell and Chris Volinsky. Matrix Factorization Techniques forRecommender Systems. IEEE press. 2009.08, 30-37

致  谢

四年的大学时光,我不仅学习到了专业方面的相关知识,进一步扩充了眼界,更重要的是掌握了学习知识的能力,使我从多方面提升了自身能力。这些中除了知识方面的,我还学习到了为人处事的方法。

在整个写论文的过程中,前期搜寻了大量的相关资料,使我逐步了解到了当前形势下的就业困难现状以及设计与实现基于Mogo的商品推荐系统的重要性,并明确了前进方向。虽然在后期遇到很多困难,我都努力去克服,最终得到学习能力、思考能力等各项综合的很大提升。

这其中,我得到了多方面的帮助。有导师的细心指导,同学的帮助关心以及在论文中借鉴的前人的部分成果,在此表示感谢。

附  录

附录正文。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值