基于大数据技术的共享单车数据分析系统设计与实现任务书

395 篇文章 17 订阅
395 篇文章 17 订阅

课题主要任务与要求:

  1. 目标及基本要求
  1. 目标
共享单车是作为移动互联网发展下的新兴产物,发展的趋势也呈爆炸式增长逐渐趋于平稳,关于共享单车的研究也越来越多。共享单车是指企业在校园、地铁站点、公交站点、居民区、商业区、公共服务区等提供自行车单车共享服务,是一种分时租赁模式。从共享单车数据中比如使用次数、骑行时间、骑行时长、起点和终点经纬度坐标属性,我们可以通过可视化更好的去了解和研究共享单车,为研究者们提供许多新的角度。我们做一个数据可视化的系统要能做到文件上传,文件解析,文件数据可视化等功能,从而进一步分析。实现功能有读取csv文件,保存并分析数据,将数据可视化:显示出发结束点,显示集散散点图,显示轨迹等。

通过毕业设计项目开发和实现,提高学生综合运用数据科学与大数据技术专业基础理论和专业知识的能力;经过科研训练,提高科学素养,提高学生的创新能力;通过项目开发实践,积累规范的系统开发经验;通过撰写论文,培养学生书面交流思想的能力;经过论文答辩,提高学生的沟通、归纳总结能力及口头表达能力;同时,还可以通过项目的合作,培养学生团队意识、合作技能与协调能力,为毕业后顺利进入工作角色打下坚实的基础。

(2)基本要求

①学术道德与规范

毕业设计报告必须独立完成,不得请他人代做,不得抄袭,毕业设计报告应进行查重,重复率不超过25%。

②数据要求

数据应真实可靠,不能伪造数据。数值型数据不少于1万条、图像型数据应满足项目开发需求。

③撰写格式要求

毕业设计报告应遵照重庆工程学院《本科设计(论文)撰写规范与范本》要求。

④毕业设计报告正文、摘要、关键字要求

毕业设计报告正文应不少于10000字。

摘要应具有独立性、完整性和自含性,即不阅读全文就能获得必要的信息。应包括四部分内容:从事这一设计(或研究)的目的和重要性;设计的主要内容,指明完成了哪些工作;获得的基本结论和设计成果,突出设计报告的新见解;结论或结果的意义。

关键词一般列出3-5个高度反映论文主要内容的专业名词(或词组)。

  1. 各阶段任务完成要求

①毕业设计开题阶段

通过查找文献资料、调研考察等方法,按照毕业设计任务书要求,以及学校毕业设计开题报告要求,完成毕业开题报告的撰写工作,并完成毕业设计开题工作。开题报告中应重点给出基于大数据技术的共享单车数据分析系统设计与实现的总体框架、涉及的主要关键技术、解决的具体路径等。

主要关键技术研究与系统设计实现阶段

a.基于文献研究,企业调研,完成共享单车数据可视化技术的设计和技术预研工作。

b.完成基于大数据平台技术的数据仓库构建等相关技术的研究工作。

c.完成专业相关的用户信息的数据采集、数据清洗、数据入库工作。

d.系统实现阶段,选择骑行开始时间、骑行结束时间、实际骑行时间、骑行距离进行聚类分析,选择Kmeans++算法作出相应的图像,对单车运营者或者用户提出一些建议或者出行指导。

③答辩阶段

完成答辩PPT及演示视频的编制工作,完成毕业答辩。

  1. 主要任务
  1. 课题开题

调研了解共享国内单车的分析系统的业务背景和现状,明确要解决的问题和技术,制定合理的实施路线,撰写开题报告。

(2)需求分析和系统结构

 功能需求:①上传文件②保存数据③读取数据④文件查询;性能需求:①文件读取快、精准②系统相应速度快③可视化图形简洁明了。系统结构:从用户层、数据库层、服务器层三个层面,设计可视化系统,综合可行性、开发性、和效率等多个方面综合考虑等,并完成技术预研。

(3)数据库设计

    结合系统业务和可视化分析目标,设计数据库,完成分析相关数据的事实表和维度表的设计。

(4)数据采集和处理

数据采集:根据可视化分析目标确定采集数据项,从美国纽约花旗citibike官网爬取相关数据,进行数据清洗后入库到数据库中。

数据处理:①数据概况②数据去重③构建观察矩阵④发现骑行

  1. 数据分析

     ①建立聚类模型:实验的目标在于发现隐藏在数据之下的信息,由于实验数据不具有标签性,故选择聚类分析进行数据挖掘。首先,本实验选择骑行开始时间、骑行结束时间、实际骑行时间、骑行距离进行聚类分析。

     ②模型基本情况解读③异常簇解读④出校骑行分析⑤骑行时长与骑行距离关系解读。

(6)前后台功能实现

①前端利用web可视化框架flask来构造前端的用户层面用来进行操作,发出指令。后台利用flask搭建的本地小型服务器,方便快捷。

②服务器收到数据之后调用echarts来进行可视化。

③利用数据可视化画散点图

④利用数据可视化每日使用情况

⑤对用户信息进行可视化

  1. 毕业设计报告

在关键技术和原型系统实现基础上,按照学校要求,在规定期间内完成毕业设计报告撰写工作。

3.成果形式

(1)开题报告;

(2)毕业设计报告;

(3)程序源代码;

(4)答辩PPT及项目演示视频(需要展示数据源)。

完成课题应注意的若干问题

(1)应独立完成毕业设计任务,注意工作节点。

(2)在毕业设计过程中应及时与指导教师联系,确保毕业设计按计划完成。

(3)网络采集的数据量应大于10000条。

(4)毕业设计(论文)项目开发完成后,指导老师要对项目进行验收,并填写《软件与人工智能学院本科毕业设计(论文)项目验收报告》。明确项目通过验收后,毕业设计(论文)项目才视为最终完成。

任务起止时间

2022年11月9日  至   2023年5月28日

进度安排

序号

各阶段工作主要内容

时间安排

备注

1

完成开题报告

2022.11.09-2022.12.11

2

项目设计与主体功能实现

2022.12.12-2023.02.26

3

完成毕业设计(论文)初稿

2023.02.06-2023.03.12

4

中期检查及项目功能完善

2023.03.13-2023.03.26

5

功能完善以及毕业设计(论文)定稿查重

2023.03.27-2023.04.16

6

毕业设计(论文)评阅

2023.04.17-2023.05.05

7

毕业设计(论文)答辩

2023.05.06-2023.05.28

主要参考文献

  1. 刘建宏.MySQL数据库优化与集群[J].数字通信世界.2017(07):38-42.
  2. 常广炎,李逦.大数据查询与分析技术——SQL on Hadoop[J].软件导刊.2016(04):78-85.
  3. 王璐,李斌,徐永龙等.基于共享单车数据的居民出行热点区域与时空特征分析[J].河南科学.2018(12):45-49.
  4. 汤諹,何祎豪,纪宁等.大学校园共享单车出行行为特征分析[J]. 交通与运输.2019(S1):65-68.
  5. 葛丽娟,葛艳波,李枫.共享单车的用户特征及其对城市交通出行的影响[J]. 综合运输.2018(04):55-60.
  6. 江慧朋,周溪召.共享单车影响下大学生出行的变化——以上海理工大学为例[J].物流工程与管理.2017(07):30-35.
  7. 唐美霞.基于大数据技术的共享单车运维问题的对策研究[J].电脑迷.2017(09):73-77.
  8. 吕雄鹰,潘海啸.基于摩拜开放数据的上海市共享单车骑行特征分析[J].上海城市规划.2018(02):12-18.
  9. Xuehong Gao,Gyu M.Lee.Moment-based Rental Prediction for Bicycle-sharing Transportation Systems Using a Hybrid Genetic Algorithm and Machine Learning[J].Computers & Industrial Engineering .2018(03):64-66.

[10] Ding Rui,WangQiang,DangYingnong.YADING:fast clustering of large-scale time series data[J].Proceedings of the VLDB Endowment.2015 (5):108-111.

指导教师(签名):            联系方式:                  年     月     日

系(教研室)意见

                       系(教研室)主任签字:     

年     月     日

  • 0
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值