随着互联网的普及和电子商务的快速发展,网上各类商品销售的商铺的数量和规模不断扩大,消费者对于商品的选择也日益多样化。为了更好地满足消费者的需求,提高销售额,本文设计并实现了一款基于spark的电商零售交易数据分析系统。系统是一款基于B/S架构的web应用,其它技术还包括python,hadoop,spark,vue,echarts,pandas等。用户首先可以通过scrapy爬虫爬取京东的各类商品信息,包括店铺信息,商品名,价格,评论,评分等。根据这些爬取的数据展示了商品销售额价格分段统计图,价格销量比统计图和商品类目销售数量统计图等可视化数据。另外用户点击一个商品,系统会根据学习叶贝斯机器学习算法推测出该商品的15天商品价格预测图。总的来说,该系统的实现不仅提高了销售数据的处理效率,而且为用户提供了更加精准的商品价格走势预测图。未来该系统还可以进一步优化算法,提高预测的准确率,帮助用户在更恰当的时候购买商品同时,也可以让商铺给自己的产品设定更合适的价格。
根据以上的功能需求情况,整体的功能模块包括有前台vue项目模块,后台django后台项目模块和爬虫模块。前台vue的页面主要页面包括注册与登录页面,数据可视化展示页面,爬虫模块主要用来爬取京东商城网的相关数据信息的,通过使用hadoop进行数据的存储,django后台用来提供前台所用的json数据以及给出价格预测的相关信息。其中商品价格预测模块的实现是基于机器学习功能之后的应用阶段。
图4.2系统功能模块图
用户进入本系统可查看系统主页信息,可视化主页面展示分为7块区域,顶部是系统的名称,下面划分为6个区域,,ABCDEF区域分布是商品销售额价格分段统计区域,价格销量比统计区域、商品列表展示区域、商品类目销售数量发布区域、商品类目销售金额发布区域和15天价格预测展示区域。主页中的图标数据主要是通过Echart框架的功能,只需要创建对应的实体类变可以获取对应的展示信息。
图5.4系统主界面图