大数据项目怎么写

数据的产生:(我们需要了解的)
1.网站的日志,游戏的日志,APP的日志。
2.电商订单。
3.保险,银行的数据。
4.网络报文。
5.运营商的项目,网络信息,通话记录,上网记录。
数据采集:
1.flume采集,flume可以监控一个目录,一个端口。
2.sqoop数据迁移工具,从RDBM迁移到Hadoop集群。
3.前期的测试时直接从甲方拿的硬盘,系统开发完成后,专门派人过去做实施。
4.ftp传输,慢。实时性强的需求做不了。

flume+kafka +storm/sparkstreaming
kafka+flume +sparkstreaming
比如说,日活10w,需要1w台服务器来支撑。
一般情况下,我们需要部署3W台服务器。

数据采集:Flume NG Logstash sqoop
数据存储:HDFS HBase Hive Kafka
数据分析:Hive MR Spark streaming SQL Storm
数据展示:Echarts Excel表格

网站点击流项目:

项目名称:可以写一些电商网站,旅游网站,APP的名称。名称尽量高大点!!不要带网站的名字。但是我们需要了解这家网站的主营业务,网站不能是淘宝,京东,亚马逊这些大网站,尽量找一些中小型的网站。
找一些不是很出名,但是网站看着还是很正规的电商平台。
ASS(B2B电商网站用户行为智能分析系统)
用户Session智能分析平台
项目所用技术:Flume/logstash,HDFS,MapReduce/Spark,Hive/SparkSQL/impala(交互式查询,速度快,基于内存),
Mysql,Sqoop,Zookeeper,SSH。
每一个框架的版本。
CDH还是HDP,不可能用Apache的。
CDH,版本5.3~5.12,选一个记住。5.8
HDP,版本2.4~2.8,选一个记住。2.6
项目周期:写好日期,2018.12018.8。时间是68个月。

项目分析:讨论项目的需求,以及架构的选择,不只是选择框架,还要选择版本,因为版本的更迭,导致功能的不断完善,我们的项目中可能会用到某些功能。
搭建集群:1~2周。7台机器,搭建完成,下午开会,需求改了, 集群版本不一样了,rm -rf /opt/*
项目开发:5

  • 4
    点赞
  • 25
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
开发一个垃圾分类大数据项目需要经过以下步骤: 1. 确定项目目标:明确你的垃圾大数据项目的目标和范围例如,你可能希望通过收集和析垃圾相关的数据来提供智能的垃圾分类建议,或者用于城市规划和资源管理。 2. 数据采集和:确定你需要收集哪些数据,并制定数据采集计划。这可能涉及到与相关机构或社区合作,获取垃圾分类、回收和处理的相关数据。一旦数据收集完成,你需要对数据进行清洗、转换和整理,以便后续分析使用。 3. 数据存储:选择合适的数据存储技术,例如关系型数据库(如MySQL)、分布式文件系统(如HDFS)或NoSQL数据库(如MongoDB)。根据项目需求和数据量大小,选择适当的存储解决方案。 4. 数据分析与挖掘:使用适当的数据分析工具和技术,例如Python中的Pandas、NumPy、Scikit-learn和TensorFlow等,对收集到的数据进行分析、挖掘和可视化。运用统计学、机器学习或深度学习算法来识别垃圾分类模式、预测未来趋势等。 5. 建立模型与预测:根据数据分析的结果,建立相应的模型来进行垃圾分类的预测和推荐。这可能涉及到特征工程、模型训练、验证和优化等步骤。 6. 开发应用程序:根据项目需求,开发一个用户友好的应用程序或平台,用于展示垃圾分类的结果和建议。这可以是一个网站、移动应用或API等形式。 7. 部署与维护:将开发完成的应用程序部署到服务器或云平台上,并确保系统的稳定运行。同时,定期更新数据、重新训练模型以保持准确性,并修复任何出现的问题。 8. 用户反馈与改进:与用户保持沟通,收集他们的反馈和建议,并根据反馈进行改进和优化。 请注意,在实施大数据项目时,还应遵守相关的法律法规和隐私政策,确保数据的安全和合规性。此外,项目的具体实现细节和技术选型可能因具体要求而有所不同。因此,在实施项目之前,建议进行详细的需求分析和技术评估。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值