基于Hadoop的京东商城数据分析的研究与实现

395 篇文章 17 订阅
395 篇文章 17 订阅

开题报告

题目

基于Hadoop的京东商城数据分析的研究与实现

1.课题研究立项依据

(1)课题来源

随着互联网信息技术的发展,企业商务模式也发生了翻天覆地的变化,很多传统企业都把目光投向了互联网电子商务。近年来,越来越多的电子商务平台的诞生,引起了电子商务业内的广泛关注。电子商务平台的兴起,随之带来的就是信息数据量的爆炸式增长,大数据产业也随之诞生。如何运用大数据技术成为目前讨论的一个热点话题

(2)科学意义

基于Hadoop的京东商城数据分析将通过分析用户行为数据,从而得到用户的喜好和偏向,通过数据可视化的界面进行呈现。数据分析的目的就是通过强大的用户数据分析、存储、计算的能力,对用户行为数据进行多维度、多方面的统计分析和查询,方便企业在进行用户行为数据分析时,能够更快捷更迅速的得到反馈,提高工作效率,帮助企业了解重要的用户统计数据,为企业运营提供数据驱动力。

(3)选题目的

电子商务运营环节中,用户行为分析和管理有着非常重要的地位。根据用户信息数据对用户购买商品的特征进行分析,从而定制相应的资源分配计划和营销策略。基于Hadoop的数据分析研究,可以构建一个大数据处理平台,不仅能够解决电商平台面临的大数据的存储等问题,更能为企业提供精准的营销能力,改善用户体验。

(4)国内外研究现状

①国外研究状况

国外对数据分析的研究起步于20世纪80年代,主要是通过研究用户的行为特征和规律来实现用户分析和网站优化。现在,在国外,用户行为数据分析已经可以通过对用户的行为特征进行分析,从而完成对资源分配的优化,提高企业的竞争力。

国内研究状况

2012年开始,我国互联网电商企业进入爆发增长期,行业竞争十分激烈,各企业也纷纷开始对用户行为数据进行分析和研究,但仍处于初步阶段。分析方法主要都是通过记录用户查询、搜索、点击等信息,通过统计分析,实现网站优化、预测用户个人喜好以及推荐相关产品。目前国内较为主流的思想是使用Hadoop平台作为用户数据存储的平台,对用户行为数据进行分析。

2.课题研究的基本内容及预期目标或成果

本课题的主要内容包括:以京东商城为例,对电商网站中的用户行为进行研究和实现;分析用户行为数据分析的应用场景并针对该应用场景进行基于Hadoop的京东商城数据分析的研究与实现。本课题通过对京东商城的数据进行采集后,形成相关数据集,进行数据预处理,根据数据集进行数据挖掘,得出相应分析结果,通过数据可视化的形式进行反馈。系统主要实现的功能有:数据获取、数据采集、数据预处理、数据挖掘、数据可视化。数据获取:实现对商城中各类数据的获取;数据采集:将获得的数据进行收集,形成数据集;数据预处理:对数据集的相关内容进行预处理;数据挖掘:将处理过的数据进行挖掘,从中提取有用的数据进行分析;数据可视化:将分析过的数据通过相应形式进行展现。

3.课题的研究方案

研究方法:

通过查阅文献、阅读资料,更全面地了解京东商城的数据分析的实现,加深对Hadoop平台的认知,使得系统可以对用户行为的数据进行多维度、多角度的分析,更好地实现用户行为数据分析系统的相关功能。

技术路线:

数据分析系统基于Hadoop平台,主要运用大数据相关技术来实现数据分析的开发。系统采用一系列数据处理技术,对数据进行分析与研究。详细实现步骤如下:

①对本课题进行需求分析以及可行性研究,明确该课题需要的相关技术;

②将所需信息进行整合,建立相关数据集,用于存放数据;

③对相关数据进行处理,并进行可视化展现;

④完成整合开发,进行系统调试并运行。

4.参考文献

[1]李红,夏咏梅,刘琳. 大数据背景下去哪儿网客户关系管理研究[C]. 劳动保障研究会议论文集(六).2020.

[2]邹鹏. 互联网数据分析系统的研究[J]. 中外企业家,2018,(7).

[3]卢爱芬. 基于Hadoop的大数据处理系统分析与研究[J]. 现代信息科技,2020,(2).

[4]于淑云,林姝敏. 基于Hadoop的大数据用户行为分析系统[J]. 北京信息科技大学学报(自然科学版),2018,(5).

[5]任璇炫. 基于Hadoop的东盟电子商务平台的研究与设计[J]. 全国流通经济,2020,(24).

[6]李依潼,王骥,任肖丽. 基于Scrapy的电商数据分析系统设计与实现[J]. 电子技术与软件工程,2020,(2).

[7]冯传新,杨保华. 基于scrapy框架的京东数据分析系统设计与实现[J]. 价值工程,2018,(28).

[8]苏杰. 基于UML的在线商城的分析与设计[J]. 电脑知识与技术,2020,(11).

[9]罗嘉龙,苏毓洲,方健炜,陈正铭. 基于大数据分析技术的用户行为分析平台设计与实现[J]. 电脑知识与技术,2019,(35).

[10]罗雨馨,姜攀. 基于大数据技术的商品精准推送系统设计与实现[J]. 电脑编程技巧与维护,2019,(12).

[11] 闵敏. 基于聚类协作过滤的商品个性化推荐系统的实现[J]. 制造业自动化,2010,32(2):157-160.

[12]谢慧敏. 基于数据挖掘的电商企业营销管理研究[J]. 品牌研究,2019,(11).

[13]王立霞,石雨琪. 基于微商的客户行为分析与兴趣挖掘[J]. 吉林化工学院学报,2018,(2).

[14]邹丹. 浅谈大数据分析在公共资源交易中的应用[C]. 创新之路——全国建筑市场与招标投标“筑龙杯”创新之路征文大赛优秀论文集.2017

[15]邹鹏. 数据分析系统可靠性的分析与研究[J]. 中外企业家,2018,(7).

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值