python电商项目介绍_电商大数据项目-推荐系统实战(一)

本文介绍了基于Spark MLLib的大数据电商推荐系统项目,适合有一定技术基础的读者,包括Linux命令、数学、Java/Scala、Git等基础知识。项目涉及Hadoop、HDFS、Spark等大数据组件,以及MySQL数据库操作。推荐系统数据来源于用户查询日志,通过Spark进行分析处理。同时,文章提供了环境搭建、数据生成和案例分析,如人口分析和电商订单数据的处理方法。
摘要由CSDN通过智能技术生成

本项目是基于Spark MLLib的大数据电商推荐系统项目,使用了scala语言和java语言。基于python语言的推荐系统项目会另外写一篇博客。在阅读本博客以前,需要有以下基础:

1.linux的基本命令

2.至少有高中及以上的数学基础。

3.至少有java se基础,会scala语言和Java EE更佳(Jave EE非必需,但是可以帮助你更快理解项目的架构)。

4.有github账户,并且至少知道git clone,fork,branch的概念。

5.有网络基础,至少知道服务器端和客户端的区别。

6.有大数据基础,最好会Hadoop,HDFS,MapReduce,Sqoop,HBase,Hive,Spark,Storm。

7.有mysql数据库基础,至少会最基本的增删改查。

你要是大神,估计看这篇博客也没有任何用处,至少给点意见和建议呗!

PC配置要求

1.CPU:主流CPU即可

2.内存RAM:至少8G,推荐16G及以上,32G不浪费。

3.硬盘:由于VM对I/O流读取速度要求高,推荐使用256G及以上固态硬盘(SATA3即可.NVME更好),系统盘需要60-100G,其余的专门划一个盘用于安装虚拟机。或者采用傲腾内存+机械硬盘的方案。

关于傲腾内存的介绍和装机方法

https://product.pconline.com.cn/itbk/diy/memory/1806/11365945.html

4.GPU显卡;无要求。但是如果你想学习深度学习框架的话,可考虑1060 6g甚至是2080TI。

5.网速:CentOS 8GB多,HDP接近7个G,CDH几个包加起来2.5G。自己算算需要下载多长时间,或者考虑用U盘从别人那里拷贝?

你也可以考虑用阿里云,腾讯云等云主机。

步骤一:

搭建CentOS+HDP的环境,或者CentOS+CDH的环境,这些都是开源的,不用担心版权问题,企业上一般也是用这两种方案。

在这里我采用的是CentOS+HDP的方案

大数据之搭建HDP环境,以三个节点为例(上——部署主节点以及服务)

https://blog.51cto.com/6989066/2173573

大数据之搭建HDP环境,以三个节点为例(下——扩展节点,删除节点,以及部署其他服务)

https://blog.51cto.com

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值