- 博客(0)
- 资源 (4)
- 收藏
- 关注
Apache 伪分布式安装教程 傻瓜式教程 步骤详细
伪分布式安装教程:
Flume
Hbase
Spark
Hive
Kafka
Sqoop
zookeeper等分布式系统框架
备注:Hadoop安装教程当时忘记记录,后续也懒得弄,所以上传资料也暂无hadoop安装教程,尽请理解!!!!
2020-04-28
大数据简历,内含有数据项目的简历,大数据 简历
大数据详细项目简历:
离线项目:于用户行为标签的智能气象服务系统
个人职责:
1.运用Flume采集源数据,存放于Kafka消息队列中
2.采用Kstream框架对数据进行初步数据清洗与变换,使用Java API将数据导入HBase
3.使用Hive集成Hbase,对数据进行ETL,进一步清洗处理数据
4.协助使用Hive提取特征值,运用Spark ML构建模型
5.参与模型检验与随机森林算法调优
6.参与编写脚本文件将数据导出到MySQL中,运用Tableau工具进行可视化分析
参与编写部分Oozie任务调度脚本,实现工作流的自动化调控
实时项目:实时气象数据展示大屏搭建
个人职责:
1.与客户对接,确定大屏上需要展现的指标,指标计算的逻辑,对应的数据源情况,数据更新的频率要求等。
2.根据具体需求,运用Flume进行实时采集日志信息,存储到kafka消息队列中
3.使用Spark Streaming对数据进行清洗、加工、处理,形成最终要展示的指标,存入MySQL,提供给前端开发。
4.研究数据结果,剖析有效信息,提出指导性意见与结论(书面、口头等)。
辅助安装小型气象站与自动化监测系统,现场布置传感器与其他设备布点。
2020-04-28
大数据简历项目 关于两个联通大数据项目和一个爬虫项目
大数据简历 内含三个项目:
项目一:联通大数据项目
项目名称: 移动终端上网数据实时分析处理系统;
开发环境: IDEA+eclipse+maven+jdk
系统架构: hadoop+zookeeper+flume+Spark+hive+mysql+sqoop+Oracle
项目二:联通大数据项目
项目名称: 信令数据实时分析处理系统;
开发环境: IDEA+eclipse+maven+jdk
系统架构: hadoop+zookeeper+Spark+hive+mysql+sqoop+Oracle
项目三:网络爬虫
项目名称: 爬取电商网站商品信息
开发环境: eclipse+mysql+maven+jdk+svn
系统架构: hadoop+zookeeper+httpclient+htmlcleaner+hbase+redis+solr+flume+kafka+storm
2020-04-28
最全 Windows搭建JAVA开发环境 配置JDK.docx
Windows搭建JAVA开发环境 配置JDK ,相信许多小白在配置JAVA环境遇到了问题,百度了然而没有什么卵用,今天为小白做一期傻瓜是JAVA环境配置教程。下面内容可能有点多,请大家认真往下看,包你学会。
2020-04-27
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人