【无标题】

摘 要

随着数字乡村振兴成为党和国家积极响应数字经济趋势、推进农业农村现代化的核心内容,农产品电商的发展已成为创新农业经济的主要方向。这一趋势的崛起为克服传统线下交易的困难提供了新动力,并为消费者带来更为便捷的购物体验。然而,由于农产品购物网站信息种类繁多、产品质量参差不齐、结构复杂,用户在海量信息中寻找有针对性的产品变得愈加困难,形成了购物网站中的信息过载问题。在这一背景下,个性化推荐的农产品购物系统应运而生。该推荐系统通过分析用户的历史行为数据,理解用户购物偏好,有针对性地推荐用户感兴趣的产品内容。个性化推荐技术作为当今最热门的前沿技术之一,应用于农产品电商,进一步推动了农村产业数字化转型,创新了农业发展模式,促进了农产品电商的蓬勃发展。
然而,当前存在的农产品电商推荐系统主要考虑用户显示兴趣对系统推荐结构的影响,却未充分考虑在农产品推荐系统中为用户推荐产品和相关服务不仅需要结合用户自身浏览兴趣,还应考虑用户相关应用情境。此外,这些推荐系统大多依赖于特定的数据基础,导致在相关用户进入系统时由于缺乏必要数据而无法执行推荐机制,从而出现稀疏性和冷启动问题。因此,本研究构建改进的非负矩阵分解模型应用到农产品电商推荐系统中,并将协同过滤算法融入到改进的矩阵分解算法中,非负矩阵分解用来对于矩阵进行特征提取 解决原矩阵高度稀疏性问题协同过滤用来计算用户相似性精准推荐并根据近邻集产生推荐列表,使得所提出模型不仅在一定程度上提高了系统为用户推荐的准确性和个性化程度,同时有效地缓解了该农产品电商系统中冷启动问题。
通过基于矩阵分解的协同过滤算法方式,本文构建了一种具有创新的农产品电商推荐模型。缓解了传统算法的冷启动问题,为推荐系统领域的进一步研究提供了有益的理论和实证基础。通过这种创新性的方法,力求在农产品电商领域实现更为精准和个性化的推荐服务,为用户提供更优质的购物体验。
关键词:农产品电商推荐;矩阵分解;深度神经网络

1.绪论
1.1研究背景与意义
1.1.1研究背景
2021年中共中央、国务院印发《关于全面推进乡村振兴加快农业农村现代化的意见》[1],这是21世纪以来第18个指导“三农”工作的中央一号文件。文件指出,要坚持把解决好“三农”问题作为全党工作重中之重,把全面推进乡村振兴作为实现中华民族伟大复兴的一项重大任务。随着中国农业现代化的推进和互联网技术的快速发展,使得农产品电商这一新兴技术产业逐渐崭露头角,成为推动农业产业升级的重要力量。农产品电商平台为消费者提供了更为便捷的购物体验,同时也为农民提供了更广阔的市场渠道。然而,随着农产品电商规模的不断扩大,用户在众多商品中寻找符合个性需求的难题日益突显。为了解决这一问题,研究基于改进矩阵分解的农产品电商推荐成为刻不容缓的任务。
中国作为农业大国,农产品产业占据着国家经济的重要地位。然而,长期以来,传统的农产品交易模式面临着信息不对称、中间环节多、价格波动大等问题,制约了农业产业的健康发展。农产品电商的兴起改变了这一局面,通过互联网技术的应用,将生产者、经销商和消费者连接在一起,实现了农产品的直接交易,为农业供应链的透明化和高效化提供了可能。然而,农产品的特殊性使得电商平台在推荐系统方面面临更大的挑战。农产品的生长周期、受天气影响、季节性等因素导致商品的更新速度较快,用户对于不同季节、地域的农产品需求也存在显著差异。因此,如何在这样复杂多变的背景下,通过智能推荐系统为用户提供个性化服务,成为当前农产品电商亟待解决的问题。
农产品电商平台中的推荐系统,不同于一般商品的推荐,需要考虑到农产品的生长特性、季节性以及用户对于不同品类农产品的个性需求。传统的推荐算法往往难以满足这一复杂多变的情境。中国农业的巨大规模和丰富多样的农产品种类使得推荐系统需要更精细化、个性化的处理,以满足用户对于农产品的个性化需求。另外,由于农产品电商平台中用户行为数据的稀疏性,用户对于某些农产品的评分信息相对较少,传统的推荐算法在处理这种数据稀疏性时存在一定的不足。如何通过有效的算法填补这些缺失的信息,提高推荐系统的准确性,是当前研究中的重要问题之一。
矩阵分解作为一种推荐系统中的经典算法,通过分解用户-商品评分矩阵,挖掘用户和商品之间的潜在关系,为用户提供个性化的推荐。在农产品电商中,这种算法具有更为广泛的应用前景。通过对大量用户行为数据的分析,可以挖掘用户对于不同季节、品种农产品的偏好,为用户提供更加符合实际需求的推荐服务。然而,当前应用于农产品电商的矩阵分解算法仍然存在一些问题。首先,由于农产品的季节性和地域性,用户行为数据的稀疏性导致矩阵分解算法的推荐准确性较低。其次,农产品的特殊性需要在算法中引入更多的上下文信息,以更好地反映用户的实际需求。因此,如何采用改进现有推荐模型,融合相关新兴技术来开发一个农产品电商推荐系统,使得系统可以快速准确从海量农产品信息及用户偏好中进行精准个性化推荐,是目前农产品电商发展中亟待解决的关键问题。
1.1.2 研究意义
目前国内外许多学者对于电商推荐平台的推荐技术应用了相关信息过滤技术,使得系统可以更便捷有效的帮助用户发现并购买他们自身所感兴趣的商品,而这一信息过滤技术正在逐渐成为电子商务平台中信息过滤技术的主要技术手段。其中利用协同过滤算法[2]、基于内容的过滤算法[3][4]等这些相关推荐算法使得在电商平台中推荐功能不需要明确用户精准的购物需求,仅仅从该用户在平台中的而浏览记录等相关特征便可以建立起针对于该用户的在电商平台中的浏览及消费偏好模型,并将符合于该用户特征的消费习惯商品、兴趣匹配度较高的潜在产品精准推送给该平台用户,从而实现了该用户在该电商平台中精准商品推动的目的。而这一推荐技术不仅成功应用于旅游平台、新闻资讯浏览平台以及电子商务平台中,同时也延续于当前热门的视频推荐系统、外卖平台推荐等。
本文通过对中国农产品电商发展现状的深入分析,发现当前农产品推荐系统平台数量激增,然而,由于系统冷启动问题以及农产品季节性时效性问题,新品引入变得相当困难。同时,由于数据稀疏性,现有农产品电商推荐平台在与之对比时凸显了个性化推荐精度不高的问题。这意味着这些平台无法快速而准确地为用户推荐所需的相关商品。此外,许多农产品电商平台增加的推荐算法复杂度较高,导致效率不高,响应速度较慢。这在一定程度上未能充分激发平台用户在线购买农产品的欲望,从而降低了平台潜在消费者的成交额。另外,目前相当一部分农产品电商平台缺乏依据农产品特有属性设计配套的推荐技术系统。
为了解决上述挑战,本文在农产品电商平台推荐系统领域持续进行探索和创新。引入协同过滤算法、改进矩阵分解等技术成为解决这些挑战的有效途径。通过改进矩阵分解的协同过滤算法使得系统能够更好地捕捉用户和商品之间的复杂关系,进而提高推荐的准确性。与此同时,采用具有时效性强、实时性好的推荐算法,系统能够更好地适应农产品的季节性和时效性变化。
总体而言,解决中国农产品电商推荐系统面临的挑战需要技术、数据和策略等多方面的综合努力。通过不断创新和优化,推荐系统有望更好地满足用户需求,从而促进农产品电商行业的可持续发展。这一努力不仅有助于提高用户体验,同时将对平台的经济效益产生积极的影响。
1.2 国内外研究现状
1.2.1农产品电商研究现状
随着近年来互联网技术的快速发展,使得人们对于电商平台等电子商务的依赖程度越来越高,并且促使相关电商平台竞争越来越激烈,在一定程度上推动了电商平台功能的细化,针对性的推出不同平台的不同产品类别细化。而针对于农产品的电商平台系统应运而生。这一产业的兴起,方便了人们的生活并且改变了人们的生活购物习惯。
国外地区农产品电商更加注重有机农业和绿色生产,为平台用户提供更加健康、环保的农产品选择,并且一些国外农产品电商发展了社区支持农业(CSA)模式,通过社区合作来为平台及用户提供新鲜农产品,加强了生产者和消费者的联系,同时为了保证当地居民对于本土风味的需求,国外电商平台着力发展本地化特色,推动本地农产品的推广及销售,具体相关实例如下表1.1所示。
表1.1 外国农产品电商发展现状
有机农业 Whole Foods Market
(全食超市) Whole Foods Market是美国一家以有机、天然食品为主的零售商。他们强调在销售过程中对有机农业的支持,通过与有机农场建立合作关系,提供健康、无化学添加的食品。其电商平台扩展了这一理念,使更多消费者可以通过在线购物体验到有机食品的便利。
社区支持农业
(CSA) Farm Fresh To You Farm Fresh To You是美国加利福尼亚州的一个CSA农产品电商平台。他们通过订阅服务为消费者提供新鲜的本地农产品,消费者可以定期收到当地农场生产的有机水果、蔬菜等产品。这种模式通过社区合作,加强了生产者和消费者之间的联系,让消费者更直接地参与到农业生产中。
本地化特色 Farmers Web FarmersWeb是美国的一个农产品电商平台,专注于连接农民和餐厅、零售商等企业。该平台强调本地化特色,帮助农民将他们的产品直接销售给当地的企业,推动本地农产品的推广。通过这种方式,农产品更加直接地流通到当地市场,满足了当地居民对本土风味和新鲜农产品的需求。
中国在2011年以后电商平台开始全面普及,使得很多中小企业都可以通过电商平台进行农产品的售卖[5]。当前“三农”的发展经历了脱贫攻关向全面小康转变,继而向全面乡村振兴跨越。具体来讲,当前的全面乡村振兴是以数字乡村振兴为主要内容,农产品电商由“数字农业”向“数字农产品”转型,农产品电商逐步成为现代农产品销售新引擎。并且竞争激烈,中国农产品电商市场呈现出平台数量激增、竞争白热化的确实,主要的电商巨头如阿里巴巴、京东等以及一些专业农产品电商平台争相进入。同时随着农产品电商的发展,中国农产品电商通过整合供应链,实现了从生产到消费的全链条服务,提高了产品的质量和流通效率。而为了适应这种农产品电商迅速发展的进程,大数据、人工智能等智能技术在中国农产品电商中得到广泛应用,用于生产管理、市场预测和用户个性化推荐等方面。在“精准扶贫”的大背景概念下,中国农产品电商平台针对我国国情积极参与电商扶贫,通过线上销售帮助贫困农民增加收入,促进农村经济发展。另一方面,随着食品安全这一消费意识的提升,消费者对产品质量和安全的关注增加,农产品电商引入了溯源系统,提高了产品的透明度和可追溯性。具体相关实例如下表1.2所示。
表1.2 国内农产品电商发展现状
供应链整合 丰谷宝 丰谷宝作为一家专注于农产品电商的平台,通过整合农业供应链,实现了从农田到消费者手中的全产业链服务。他们与农民建立合作关系,保障产品质量,提高了流通效率,使得消费者能够更便捷地获取优质农产品。
电商扶贫 中国农产品电商平台“农村淘宝” 农村淘宝是阿里巴巴旗下的农产品电商平台,通过线上销售帮助贫困农民增加收入。这种电商扶贫的模式促进了农村地区的经济发展,让农产品更好地融入市场。
溯源系统 丰谷宝的“产地直达” 丰谷宝推出了“产地直达”服务,通过溯源系统,消费者可以追溯到农产品的生产地、生产过程等详细信息。这种做法提高了产品的透明度,增强了消费者对产品质量和安全的信心。
综上,发展农产品电子商务,促进农产品流通与农村经济发展是我国政府重点关注的课题,农产品电商作为巩固拓展脱贫攻坚成果的重要载体、数字经济的重要组成部分、乡村振兴的新动能,中国的现代化离不开农业农村现代化,随着科学技术发展,各大电商平台正将农业科技、大数据技术、人工智能应用到农产品电商的发展,持续推进农产品电商发展[6]。
1.2.2 推荐算法研究现状
推荐算法是信息检索和个性化推荐系统中的关键技术,旨在根据用户的兴趣和行为,向其推荐可能感兴趣的物品或信息,而评价一个推荐算法是否优秀的相关指标主要为该推荐算法应用的系统生成的推荐是否与用户真实兴趣一致的准确性、该推荐算法应用的系统是否能够涵盖用户兴趣空间中的多样性的覆盖率、该推荐算法应用的系统是都在推荐结果中具备物品之间的多样性,而避免过度推荐相似物品的多样性、该推荐算法应用的系统是否能够给用户推荐他们之前未曾接触的物品的新颖性以及该推荐算法引用的系统是否能够及时地适应用户兴趣变化地实时性。目前国内外学者针对上述不同地标准,将推荐算法划分为如下图1.1所示几大类别[7]。

图1.1 推荐方法分类
如上图所示,目前推荐算法主要被分为了基于内容的推荐算法、基于协同过滤的推荐算法以及混合推荐算法。那么其中在基于协同过滤的推荐算法中用户K近邻协同过滤算法和商品K近邻协同过滤算法属于基于内存的协同过滤算法,矩阵分解系统过滤算法、聚类协同过滤算法以及基于贝叶斯网络协同过滤算法则属于基于模型的协同过滤算法。
其中,基于内容的推荐算法是一种考虑用户和物品的特征信息,通过分析内容属性来实现推荐的方法。其核心思想是将用户的历史行为和物品的属性联系起来,从而理解用户的兴趣,并推荐与用户过去喜欢的内容相似的物品。该算法主要由商品的特征分析模块、用户的特征学习模块和系统用户偏好预测模块这三大部分构成,

图1.2 基于内容的推荐算法结构流程图
如上图所示,通过对于商品内同的非结构化描述进行商品特征分析,从而得到结构化的可被存储的商品特征,利用该商品特征中用户评价的商品结合用户反馈数据的进行结构化的用户特征分析并存储,以及利用目标用户的特征和系统中商品特征进行饥饿和预测,实现对于目标用户的商品个性化推荐,并利用该目标用户对于商品推荐列表的反馈再次形成用户反馈数据闭环,形成该基于内容的推荐算法结构流程。这一算法流程至今仍被广泛应用,其中在信息检索领域中Belkin[8]等人将TF-IDF算法[9]引入了基于内容的推荐算法应用的系统中。Balabanovi[10]等人则基于此项技术利用TF-IDF值最高的文档中100个单词来表示该系统平台中商品所具备的相关特征。而在音乐播放平台中Loeb等人[11]利用音乐播放平台的播放记录,学习用户听歌的行为特征,并引入基于内容的推荐算法向该平台用户个性化推荐其所喜欢的音乐。在一种网络路径的推荐系统WebWatcher中Joachims等人[12]利用这种基于内容的推荐算法使得在该系统中,可以通过用户在网络浏览器中的浏览数据学习用户的上网偏好,帮助用户高效的访问互联网,并针对性的向网站用户推荐他们自身可能感兴趣的网络链接。Pazzani等人[13]则推出了一种基于内容的推荐算法技术的网站推荐平台Webert,该平台基于这种内容推荐算法技术通过朴素贝叶斯分类器使得可以呈现一种增量式学习用户行为轨迹的兴趣模型。
在国内,对于基于内容的推荐算法主要涉及了文本内容分析、多模态融合以及个性化推荐应用三个研究方向,其中在国内,研究者关注对文本内容的深入分析,例如用户产生的评论、物品的描述等,以更好地理解用户的兴趣。并且随着多模态数据的兴起,国内研究者探索了将图像、文本等多模态信息融合到推荐中,提高了推荐的多样性。而且基于内容的推荐在国内的电商、社交媒体等领域得到广泛应用,以提高个性化服务水平。
综上所述,综合而言,基于内容的推荐算法在国内外都取得了显著的研究进展。国外更注重深度学习和多模态信息融合,而国内更侧重于文本内容分析和个性化推荐应用。未来,随着数据的增加和算法的不断优化,基于内容的推荐算法将继续发挥重要作用。但该推荐算法在商品特征分析中并不具有普适性,需要专门针对不同领域商品特征进行特定知识的学习,以及基于内容的推荐算法主要依赖于物品的特征,而较少利用用户的历史行为数据。这使得这种算法在个性化程度上可能不如协同过滤等方法,尤其是对于新用户或用户行为稀疏的情况,推荐的结果缺乏一定的新颖性。并且因为缺乏与之相关的历史行为数据,算法难以准确理解和预测兴趣。使得系统在面对新物品或新用户时,存在冷启动问题等。
基于协同过滤的推荐算法是一类推荐算法,基于用户之间的相似性或物品之间的相似性来进行推荐。它的核心思想是根据用户历史行为或偏好,找到具有相似行为的其他用户或相似物品,并向目标用户推荐这些用户喜欢的物品。根据计算相似性的方法以及算法具体实现路径的不同,协同过滤可以分为两种主要类型[14],如下表1.3所示
表1.3 基于系统过滤的推荐算法分类表
用户-用户协同过滤 基于用户之间的相似性,推荐与目标用户相似用户喜欢的物品
通过计算用户之间的行为相似性,如余弦相似度、欧式距离等,确定相似用户群体
物品-物品协同过滤 基于物品之间的相似性,推荐与目标物品相似的其他物品
通过计算物品之间的关联度,如余弦相似度、基于内容的相似性等,确定相似物品群体
协同过滤是一种基于“群体智慧”的基本思想,并适用于推荐一定程度上复杂、抽象的商品,也并不需要用户及商品的具体信息,仅仅利用用户对商品的反馈数据就能完成针对目标用户的个性化推荐。首先在基于内存的协同过滤算法中,最主要被广泛使用的是一种基于用户[15]或商品[16]的K近邻(K-Nearest Neighbors,KNN)的推荐算法,具体二者算法流程如下图1-3所示。

基于用户K近邻的推荐算法如图1.3中(a)部分所示,主要有五个步骤:
(1)用户相似度计算。计算用户之间的相似度,常用的相似度计算方法包括余弦相似度、皮尔逊相关系数等;
(2)构建用户相似度矩阵。利用矩阵中的每个元素表示两个用户之间的相似度;
(3)找到K近邻用户。对于目标用户,找到与其相似度最高的K个用户,这就是用户K近邻;
(4)预测目标用户对未评价物品的喜好。利用用户K近邻的历史评分信息,通过加权平均或其他方法预测目标用户对未评价的物品的喜好;
(5)生成推荐列表。根据预测的用户喜好值,为目标用户生成推荐物品列表。
基于商品K近邻的推荐算法如图1-3中(b)部分所示,主要有五个步骤:
(1)物品相似度计算。计算物品之间的相似度,同样使用余弦相似度、皮尔逊相关系数等方法;
(2)构建物品相似度矩阵。利用矩阵中的每个元素表示两个物品之间的相似度;
(3)找到K近邻物品。对于目标物品,找到与其相似度最高的K个物品,这就是物品K近邻;
(3)预测目标用户对未评价物品的喜好。利用用户对已评价物品的评分信息,结合物品K近邻的相似度,通过加权平均等方法预测目标用户对未评价的物品的喜好;
(4)生成推荐列表。根据预测的用户喜好值,为目标用户生成推荐物品列表。
但是基于内存的协同过滤算法中基于用户/商品K近邻(KNN)的推荐算法虽然在某些方面表现出色,但也存在一些数据稀疏性、冷启动问题、计算复杂度、维度灾难、对异常值敏感以及预测的不稳定等局限性。在真实世界的用户-物品评分矩阵中,大多数用户只评价了少数物品,导致用户-用户或物品-物品之间的相似度难以准确计算。因此KENDALL等人[17]提出了SRC等级系数这一著名相似性度量方法,用于计算系统中用户或者商品之中的相似度。对于大规模和稀疏的数据集,KNN方法可能无法找到足够数量的邻居,从而影响推荐的准确性。因此Daniel Lemire和Anna Maclachlan[18]等人便提出了一种通过两个用户在系统中对同一件商品评分中二者评分的差值来进行对商品“流行度”差异的标记点这一Slope One算法在一定程度上解决该问题。再者为了解决该算法中的相关问题,Ma,Hao等人[19]在算法中引入了一个惩罚系数用来降低具有较少用户共同评价的商品所占权重。Zheng等人[20]则将上述两种UserKNN算法和ItemKNN算法相结合,提出一种新的推荐算法UIPCC,这种算法是一种基于皮尔逊相关系数的推荐算法。随着用户数和物品数的增加,相似度计算的复杂度会呈现二次或更高的增长趋势。在大规模数据集上,相似度计算的高计算复杂度可能导致推荐过程变得非常耗时,不适用于实时推荐。为了提高计算效率潘红艳[21],张海鹏[22]等人通过采用一种对于评分矩阵进行分部分分块来降低在推荐过程中降低邻域选择的计算复杂度。因此在实际应用中,要克服这些局限性,可以采用一些改进的KNN算法、结合其他推荐算法或引入深度学习等技术。综合考虑不同的方法,可以提高基于内存的协同过滤算法的性能和鲁棒性。
基于模型的协同过滤算法主要通过构建数学模型来预测用户对未评价物品的喜好程度,从而实现个性化推荐。这一推荐算法的出现可以在数以万计用户和商品的系统中通过采用相关方式计算任意两个用户或商品彼此间的相似度后进行邻域选择,该算法通过增加一个额外的模型训练步骤,将训练好的模型嵌入之系统进行评分预测以及针对目标用户的个性化推荐,这个模型在嵌入后不依赖于商品或用户的评分即可快速推荐。其中主流基于模型的系统过滤算法主要有三种,即基于矩阵的分解方法、聚类协同过滤算法以及基于贝叶斯网络协同过滤算法。其中在基于矩阵分解方法中的分类主要由下表1.4所示。

表1.4 基于矩阵分解的方法分类

  • 28
    点赞
  • 23
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值