文章目录
0 前言
Hi,大家好,大四的同学马上要开始毕业设计啦,大家做好准备了没!
学长给大家详细整理了最新的 大数据专业 相关选题,对选题有任何疑问,都可以问学长哦~
🧿 选题指导, 项目分享:
https://gitee.com/yaa-dc/warehouse-1/blob/master/python/README.md
1 如何选题
如何选题这是大部分同学最关心的事情,选的太难怕做不出,选的太简单又怕答辩没法通过,天临、卢雷这几个持续推高毕业的难度,预计从2023年开始本科毕业答辩难度会上升好几个level ~
1.1 选题技巧:如何避坑(重中之重)
毕设选题实际上对很多同学来说一个大坑, 每年挖坑给自己跳的人太多太多,选题选得好后面的答辩以及论文撰写会轻松很多,选的不好就是一个无穷无尽的折磨。。。。
1.2 为什么这么说呢?
其实这主要是由于大部分同学对某种具体场景所需要的技术不清晰而导致的,定题的时候想当然的觉得某种功能是很好实现的,但是实际上往往并非如此。
所以,建议对课题实现技术不清晰的同学,最好是找自己的研究生学长或者老师详细的把关机技术以及实现流程理清楚,当然也可以来问我。
1.3 难度把控
(对于只要求顺利毕业的同学)定题不能定的太难,也不能定的太简单。太难了,自己做不出;太简单了,工作量不够,论文也没法写, 甚至进不了答辩。
1.4 题目名称
还有,最近很多同学跟学长反应,自己定的题目总是被老师打回去,这还真不怪老师,我看到你们定的题目也是哭笑不得。。。。。
学长在这里给你们分享一个定题标准,跟着这个标准定题准没错:
“使用了什么算法(技术) + 在什么场景下 + 解决了哪一类问题”
1.5 最后
学长限时开放开题指导,对开题有任何不明白的,对某项技术或算法不理解的,不知道怎么下手毕设的,都可以问学长,学长会根据你的情况提供帮助,希望能帮助到你。
2 选题推荐
注意🚩:已下选题为学长设想的,选题具体还需要结合自身的情况进行,最好来问问学长,根据你自身情况进行推荐!
2.1 🔥🔥 数据分析可视化选题推荐 🔥🔥
🥇 天气数据的预测分析及可视化
数据集:爬取2345天气网;
分析可视化技术:使用Pandas进行数据分析,Echarts进行可视化,使用Flask框架;
功能:温度分析、天气分析、风向分析、空气质量分析、机器学习、对空气质量进行预测,登录注册
创新点:加入对空气质量的预测,让用户可以了解到天气情况的同时,还能够查看未来空气质量的预测结果
🥇 Boss招聘数据分析可视化
数据集:Boss直聘网站爬取
技术:使用Pandas进行数据分析、echarts可视化、Flask框架、MySQL数据库
功能:不同岗位的学历薪资对比、学历要求、经验要求、经验薪资、岗位属性、技术词云等,薪资预测和岗位匹配
创新点:对不同的技术岗位进行分别分析,例如Java、Python、测试、前端等,让不同岗位之间能够形成对比
🥇 基于Hadoop的农产品价格信息检测分析
数据集:爬取VIP蔬菜网的农产品数据
技术:使用pandas数据处理、Hadoop数据分析、MySQL数据库、Flask框架
功能:农产品价格趋势、农产品价格检索、不同市场价格对比
创新点:在对蔬菜数据的分析可视化基础上,加入了Hadoop分析
🥇 基于Hive的北京二手房数据分析
数据集:爬取贝壳网的北京二手房数据
技术:Flask、Pandas、Hive、MySQL
功能:基于Python以二手房信息为对象,爬取二手房价格、小区名称、地区、房屋数量、建造时间等信息,同时将数据存储于数据库,并利用Pandas清洗数据。其次,采用Hive数据仓库,对爬取的数据进行分析。最后,基于Django、Echart可视化框架,对分析结果进行可视化展示。
创新点:通过Hive对数据进行存储和分析,分析的结果存入MySQL数据库,增加了分析的效率和页面读取的速度。
🥇 基于spark的招聘网站数据分析系统
数据集:爬取前程无忧的招聘数据
技术:Flask、Pandas、PySpark、MySQL
功能:爬取城市、岗位、学历要求、经验要求等信息,利用Pandas进行数据处理、PySpark进行数据分析,同时将分析后存储于数据库,并利用Flask进行可视化结果的展示。
创新点:对爬取的招聘数据,加入PySpark技术,提升对数据的分析效率。
🥇 基于Python的电商大数据画像系统
数据集:阿里云提供的电商用户行为数据集
技术:jupyter、MySQL、Flask、Echarts
功能:对数据进行处理、分析,分析结果存入数据库,最后在Web端展示,对用户维度、物品维度和用户画像出发进行分析可视化
创新点:在对用户行为数据分析的基础上,加入了对用户画像的构建,将用户分为不同的类别。
🥇 基于Python实现电商订单的数据分析
数据集:一家全球超市4年内的电商销售订单数据
技术:Python、MySQL、Flask、Echarts
功能:利用Python数据分析技术,从年度销售维度、地区销售维度和用户分类维度进行了分析,分析的结果在MySQL数据库进行了持久化存储。最后使用Flask搭建可视化平台,展示了数据分析的结果,利用Echarts进行可视化。
创新点:在对数据进行分析可视化的基础上,加入了RFM用户分类
🥇 基于大数据的电影数据爬取与可视化系统的设计与实现
数据集:爬取的豆瓣网电影数据
技术:Python、Echarts、Flask、协同过滤推荐
功能:电影数据爬取、注册登录、电影推荐、电影评论、用户管理、电影评论管理、数据可视化
创新点:使用协同过滤推荐算法,创建了电影推荐网站,同时还囊括了多种数据可视化图标,能够让用户在查找电影的同时查看到电影数据的整体情况
🥇 基于Python的动漫分析系统设计与实现
数据集:爬取的B站动漫信息
技术:采用Python技术和方法设计和实现了动漫分析系统,设计过程中使用了B/S架构,前端使用HTML、bootstrap、Echarts技术,后端使用Flask框架
功能:系统功能包括数据爬取、数据分析和数据可视化三大模块,以及动漫类型分析、动漫导演分析、动漫声优分析、动漫脚本分析、国漫日漫对比、播出时间分析以及动漫词云分析等子功能模块
创新点:使用大量的可视化图形从不同的维度去分析动漫数据的特征,分析维度包括动漫类型、导演、声优、脚本、播出时间、词云等多个维度
🥇 基于大数据的动漫推荐系统的设计与实现
数据集:爬取的B站动漫信息
技术:Python、Echarts、Flask、协同过滤推荐
功能:动漫数据爬取、注册登录、动漫推荐、动漫评论、用户管理、动漫评论管理、数据可视化
创新点:加入协同过滤推荐算法,通过用户对动漫的收藏进行推荐
🥇 电影票房数据分析可视化
数据集:爬取猫眼电影数据、对电影评论数据的爬取;
分析可视化技术:使用Pandas进行数据分析,NLP进行情感分析,Django搭建可视化平台;
功能:电影票房数据可视化、登录注册、信息展示、信息管理、分析和可视化,对电影评论的情感分析,对比票房和情感分析结果的关系
创新点:将票房与评论的情感分析结果进行结合,让用户更快的了解一个电影的票房和口碑对比。
🥇 豆瓣网站书籍数据分析
数据集:爬取豆瓣网书籍数据、书籍评论数据;
分析可视化技术:使用Pandas进行数据分析,NLP进行情感分析,Django搭建可视化平台;功能:数据可视化、情感分析、词云展示、登录注册、信息展示、信息管理,对书籍评论的情感分析,对比评价人数和情感分析结果的关系
创新点:将情感分析加入书籍分析中,让用户更快的了解到读者们对一个书籍的情感倾向
🥇 房产数据分析可视化
数据集:使用scrapy爬取贝壳网租房数据。
分析可视化技术:使用Pandas进行处理和分析,使用Django搭建可视化页面,结合Echarts进行可视化。
功能:租房信息显示、详情查看、登录注册、评论、信息管理等
创新点:将爬取下来的房产数据进行进一步的展示、让用户在查看可视化结果之后,也能够进行房屋信息的浏览。
🥇 京东服装推荐系统
数据集:爬取京东网站服装数据;
分析可视化技术:使用Pandas进行数据分析,Django搭建可视化平台;
功能:数据可视化、我的收藏、商品推荐、登录注册、信息展示、信息管理、对数据的收藏、推荐。
创新点:在数据爬取可视化的基础上加入了推荐算法,通过用户的收藏行为,完成为用户的协同过滤推荐
🥇 就业数据的分析及推荐
数据集:爬取前程无忧招聘数据;
分析可视化技术:使用Pandas进行数据分析,Django搭建可视化平台;
功能:数据可视化、我的收藏、就业推荐、登录注册、信息展示、信息管理、对数据的收藏、推荐。
创新点:在数据爬取可视化的基础上加入了推荐算法,通过用户的收藏行为,完成为用户的协同过滤推荐
🥇 卡塔尔世界杯数据可视化
数据集:爬取tzuqiu数据。
分析可视化技术:使用Pandas进行处理和分析,使用Django搭建可视化页面,结合Echarts进行可视化。
功能:新闻信息显示、详情查看、登录注册、评论、信息管理等功能
创新点:卡塔尔世界杯为数据分析对象,同时加入了一些卡塔尔世界杯相关的新闻展示,丰富网页内容
🥇 社区新生儿疫苗接种分析可视化
数据集:模拟社区新生儿疫苗数据;
分析可视化技术:使用Pandas进行数据分析,Django搭建可视化平台;
功能:登录注册、信息展示、信息管理、数据可视化、数据汇总、疫苗查询、信息管理功能创新点:将社区新生儿疫苗接种数据进行整理和可视化分析,同时提供了疫苗查询功能,可以根据儿童年龄大小来查看需要注射的疫苗以及注意事项
🥇 手表数据监控及分析可视化
数据集:互联网获取相关数据;
分析可视化技术:使用Pandas进行数据分析,Django搭建可视化平台;
功能:登录注册、信息展示、数据可视化身体状况数据分析、整体数据分析、数据展示、数据管理、数据监控等。
创新点:通过对运动手表的数据进行监控和分析,从而完成对人身体状况的了解,当出现紧急情况时也可以进行警报
🥇 弹幕数据分析可视化
数据集:爬取b站弹幕数据。
技术:Flask、Echarts。
功能:数据爬取、数据处理、数据可视化、弹幕情感分析
创新点:加入文本分析技术,对弹幕进行文本处理和情感分析,分析出一个视频的弹幕情感倾向分布
🥇 基于Python+Flask豆瓣爬虫可视化分析
数据集:爬取的豆瓣电影数据
技术:Python、Echarts、Flask
功能:电影数据爬取、数据处理、注册登录、地区分析、年份分析、类型分析、分国家年份分析、词云分析
创新点:通过豆瓣电影数据为例,通过不同的维度进行丰富的分析
🥇 基于Flask的豆瓣图书可视化分析
数据集:爬取的豆瓣图书数据
技术:Python、Echarts、Flask
功能:图书数据爬取、数据处理、数据展示、图书地区分析、出版社分析、出版时间分析、评分分析
创新点:使用大量的可视化图形从不同的维度去分析图书数据的特征,分析维度包括图书地区分析、出版社分析、出版时间分析、评分等多个维度
🥇 基于Python的高校学情分析可视化
数据集:教务处成绩表
技术:Python、Echarts、Flask、MySQL
功能:数据处理、数据分析、整体学情可视化、单科成绩可视化、成绩列表查看、个人信息管理
创新点:以学情分析为核心,展示学期内学校的学情,方便教师、家长或者学校决策者进行参考
🥇 基于Python的共享单车数据可视化
数据集:SODA上海开放数据创新应用大赛提供的摩拜单车数据
技术:结合Python语言对数据集提取,利用Pandas库对数据集去重,去重后导出到csv文件中,运用Python中的Flask框架搭建Web页面,结合百度地图API,展示对共享单车数据进行可视化结果
功能:分析和可视化的功能主要有计算骑行时长、计算一天骑行时长、计算工作日骑行、计算骑行距离、用户分类、经纬度分析,
创新点:对共享单车数据进行分析,使用地图来展示当前共享单车的分布情况
🥇 考研数据分析与可视化
数据集:历年考研英语真题
技术:Python、Echarts、Flask、MySQL
功能:对历年英语真题试卷pdf进行读取,统计词频,去除停用词,统计出现词频最高的单词,以及不同年份词频的趋势
创新点:以考研英语试卷为主题,分析历年试卷的高频词汇,帮助考研学子更加有针对性的进行复习
🥇 旅游景点印象分析
数据集:爬取的携程网站的景点数据以及景点评论数据
技术:Python、Echarts、Flask、文本处理技术
功能:对景点数据进行统计分析,对评论数据进行词频统计、分词、文本处理、情感分析等操作
创新点:通过对景点评论数据的爬取,让游客在掌握整体旅游情况之后,可以更加精准的了解到一个景区的整体印象,以此来决策出行计划
🥇 基于Python的二手车数据可视化平台的设计与实现
数据集:爬取二手车之家的数据
技术:使用B/S结构,MYSQL数据库,基于Flask框架
功能:实现了通过网络爬虫爬取网页相关信息,对爬取到的信息进行处理及存储,为用户提供分析查看,并且采用图形界面的方式展示给用户
创新点:通过可视化大屏的方式对二手车的分析结果进行展示,更加直观的为二手车的买家和卖家提供帮助
🥇 热门电视剧数据分析可视化
数据集:爬取爱奇艺网站的电视剧数据
技术:使用B/S结构,MYSQL数据库,基于Flask框架,Pandas工具
功能:实现电视剧查看、电视剧收藏、电视剧搜索、主演分析、类型分析、上映年份分析、热度分析、弹幕数量分析等等
创新点:以当前热门的电视剧为主题,将电视剧进行爬取展示,同时进行可视化的分析,让观众更好的掌握当前电视剧市场的情况。
🥇 热门游戏数据可视化
数据集:互联网公开数据集,数据包括数据属性包括排名、名称、平台、年份、类型、出版商、北美销售、欧洲销售、日本销售、其他销售、全球销售等等.
技术:Flask、MySQL、Echarts
功能:数据获取功能、数据清洗功能、数据分析功能、可视化功能。在数据的分析部分,主要分为销量排名、欧洲销量排名、游戏发布年份、各类游戏占比、各类别游戏销量等模块
创新点:以游戏销售数据为主题,分析不同游戏的销售情况,展示游戏市场的整体情况
🥇 基于Python的厦门二手房分析和可视化
数据集:爬取的58同城二手房数据
技术:Flask、MySQL、Echarts
功能:数据获取功能、数据清洗功能、数据分析功能、可视化功能
在数据的分析部分,主要分为不同建造时间、不同区域、房价随时间变化、房屋数量、词云、数据聚类等模块
创新点:在数据分析可视化的基础上,加入了对房屋数据的聚类分析,帮助用户更好的了解房子市场的情况
🥇 基于Python的美妆销售数据可视化分析
数据集:利用天猫平台美妆 12 个类别的电子商务交易数据
技术:Flask、MySQL、Echarts
功能:系统分为三大部分,不同的部分下又拥有其子功能。数据获取模块包括数据获取和数据预处理;各平台数据概览模块包美妆各类商品数量、美妆各类商品销量、美妆各类商品平均价格、美妆商品销量Top10、淘宝平台商品销量Top、美妆Top10销量店铺,类目分析模块包括美妆各类商品价格区间、美妆各类商品销量占比、销量和价格对比等。
创新点:以美妆商品为研究对象,针对性的对美妆数据进行可视化,展示美妆市场的分布情况
🥇 基于python的小说分类数据可视化分析
数据集:爬取爱久久小说网的小说数据
技术:Flask、MySQL、Echarts
功能:图书展示查询、小说类型可视化、作者排名、出版年份分析、文件大小分析、不同年份小说分类发布情况、不同类型小说词云
🥇 基于Python的音乐数据可视化系统
数据集:爬取千千音乐网站的音乐数据
技术:Flask、MySQL、Echarts
功能:用户登录、信息采集功能、信息分析功能、数据可视化功能、音乐收藏、音乐推荐
创新点:对音乐数据进行爬取、分析、可视化、同时加入了音乐推荐算法,能够根据用户的收藏行为进行协同过滤推荐
🥇 用户购物行为分析系统
数据集:阿里云提供的淘宝用户购物行为数据
技术:Flask、MySQL、jupyter、Echarts
功能:用户维度分析、产品维度分析、聚类结果分析。
创新点:对购物行为进行数据分析,同时利用聚类算法将用户分为不同的类别,并根据不同类别的特征进行标注
🥇 租房+招聘数据分析可视化系统
数据集:分别爬取58同城的招聘数据和租房数据
技术:Flask、MySQL、Echarts
功能:分别对租房数据和招聘数据进行可视化,并且对不同区域的招聘薪资和租房价格进行对比,其他功能包括登录注册、信息管理、个人信息管理、词云等。
创新点:将租房和招聘数据融合在一起,能够查看同一个地区的招聘和租房情况对比
🥇 基于PySpark的YELP数据集分析可视化
数据集:YELP数据集
技术:Flask、MySQL、Echarts、PySpark
功能:分析的维度包括商业类别、美国10种主要的商业类别、每个城市各种商业类型的商家数量、商家数量最多的10个城市、消费者评价最多的10种商业类别、最受消费者喜欢的前10种商业类型、商业额外业务的评价情况
创新点:对商业数据进行分析可以帮助创业者和投资者提供建议
🥇 QQ音乐数据可视化
数据集:QQ音乐的歌单数据集
技术:Flask、MySQL、Echarts
功能:系统主要实现了最受欢迎歌单类型TOP7、最受欢迎的歌单TOP5、歌单收藏量变化、男女创建歌单数量对比、歌单歌曲数量范围等。最终通过可视化大屏进行展现
创新点:通过可视化大屏,能够让数据更加生动的进行展示
🥇 大学生心理健康数据分析
数据集:宁夏一些高校从2018年到2022年大学生的心理健康数据
技术:Flask、MySQL、Echarts
功能:分析维度具体包括系统登录、信息查询、不同专业调查人数、男女心里困扰情况分布、独生子女对心理健康的影响、户口类型对心理健康的影响、男女焦虑原因分布、男女抑郁情况对比、各专业心理健康情况对比等。最终通过可视化大屏进行展现
创新点:通过可视化大屏,能够让数据更加生动的进行展示
🥇 如家连锁酒店数据分析
数据集:数据的来源为八爪鱼爬取
技术:Flask、MySQL、Echarts
功能:分析维度包括酒店印象可视化、各地区销量可视化地图、销量随时间变化分析、热门房型分析、 出游类型分析、出游类型评分分析、好评词云、差评词云。最终通过可视化大屏进行展现
创新点:通过可视化大屏,能够让数据更加生动的进行展示
🥇 当当网图书数据分析与挖掘
数据集:爬取当当网的图书的销售数据
技术:Flask、MySQL、Echarts
在数据的分析部分,主要分为四个维度,分别是类型、出版社、作者、出版时间,分别分析不同维度的平均价格、平均评论人数,分析不同维度下平均价格和平均评论人数之间的关系,从而让用户直观的看出数据的潜在内容
创新点:在对数据进行分析的基础上,加入了聚类算法,对不同的图书进行聚类,并且对聚类结果进行绘图,查看不同类别的特征。
🥇 旅游数据分析可视化
数据集:对携程旅游数据爬取
技术:Flask、MySQL、Echarts
功能:数据爬取模块主要分为对旅游景点数据的爬取、预处理和存储,数据分析模块主要包括了评分最高景区的分析、不同评分的景区个数分析、评价人数分析、星级分析、景区人流量预测以及词云五个部分的图表展示。
创新点:对旅游数据进行分析可视化,让用户可以快速了解一个地区的景区情况,同时对人流量进行预测,让游客可以提前做好出行规划。
🥇 社交媒体用户热词挖掘
数据集:爬取社交媒体中的文本数据
技术:通过综合应用Python技术、NLP模型、Flask框架
功能:对微博网站所采集到的相关信息及时进行清洗、筛选、分词以及分析。将分析过后的数据存储到数据库中。对分析过后的数据进行可视化展示,制作高频词汇的词云,方便用户更直观看出此时的热点,再利用NLP和贝叶斯进行微博言论的情感分析。
创新点:通过可视化大屏,能够让数据更加生动的进行展示
2.2 🔥🔥 算法类选题推荐(深度学习机器学习) 🔥🔥
🥇 基于机器学习的反电信诈骗系统
数据集:互联网公开渠道获取。
技术:决策树、SVM算法、Django、MySQL。
功能:短信展示、诈骗短信判断、短信分析可视化、数据集管理。
🥇 基于机器学习的垃圾短信过滤识别系统
数据集:互联网公开渠道获取。
技术:决策树、SVM算法、Django、MySQL。
功能:登录注册、短信展示、垃圾短信判断、短信分析可视化、数据集管理。
🥇 基于机器学习的敏感话题识别系统
数据集:爬取的微博相关数据。
技术:贝叶斯算法、Django、MySQL。
功能:登录注册、微博展示、敏感话题判断、手动爬取数据、数据集管理。
🥇 基于LSTM的电商评论情感分析
数据集:爬取的京东评论相关数据。
技术:Flask、Sklearn。
功能:数据爬取、数据处理、数据可视化、情感分析、词云展示。
创新点:可手动指定爬取目标,分析目标的相关评论内容数据
🥇 基于LSTM的股票数据预测
数据集:爬取相关股票数据
技术:使用Pandas进行分析、Flask搭建页面
功能:股票爬取、数据处理、股票展示、数据可视化、股票预测、股票分类、股票推荐
🥇 基于Python的5G套餐潜在客户预测系统的设计与实现
数据集:数据来源为中国移动历史数据。该数据集覆盖了用户的基本资料、消费信息、超套信息、宽带信息、其他信息等维度
技术:使用Python语言,Pandas进行数据处理,Echarts可视化、Flask搭建框架、随机森林算法预测
🥇 LSTM+Holt实现北京市空气质量数据可视化分析
数据集:爬取2345天气网;
分析可视化技术:使用Pandas进行数据分析,Echarts进行可视化,使用Flask框架;
功能:温度分析、天气分析、风向分析、空气质量分析、机器学习、对空气质量进行预测,登录注册
🥇 基于spark的房价数据分析预测推荐系统
数据集:爬取58同城房价数据
技术:Pandas、Spark、Echarts、Flask、协同过滤推荐
功能:数据爬取、数据处理、数据可视化、房价预测、房屋推荐、数据管理、用户管理
🥇 基于Python的面部健康特征判别系统
数据集:互联网获取的公开数据集,分为健康、亚健康和不健康,面部表情张图片共有1000张,舌头图像共有1000张
技术:Python、Flask、MobileNet
功能:主要分为模型训练和前台识别测试界面,界面中包含图像上传、识别结果返回的功能。模型训练包括读取图像、处理图像、模型训练、利用训练好的模型进行图像识别等。
🥇 基于决策树的企业员工离职率分析和预测
数据集:来源于Kaggle,是某公司的离职数据,包含14999条记录
技术:Pandas、Flask、决策树
功能:数据数据处理、数据可视化、手动添加数据进行员工离职预测
🥇 基于Python新闻文本分类的设计与实现
数据集:通过爬取中国新闻网站的网页数据获取
技术:采用了Python语言、Flask技术、B/S架构、贝叶斯算法。
功能:通过Python爬虫代码对新闻数据进行获取,获取的新闻数据包含了对应的分类标签。其次对获取的新闻数据进行处理,处理方法包括去除重复值、去除异常值、截取纯文本和标签列等等;然后对新闻数据进行简单的分析可视化,查看数据分布的规律;最后利用朴素贝叶斯模型,对新闻文本数据进行分类,分类之前要进行分词、去停用词、向量化等处理,得到模型之后对模型效果进行评估。
🥇 基于数据挖掘的高校学生行为与成绩的关联性研究
数据集:本次采用的数据集来源于智慧中国杯,数据内容为20132014、20142015两学年的学生在校行为数据作为原始数据,包括消费数据、图书借阅数据、寝室门禁数据、图书馆门禁数据、学生成绩排名数据
功能:本课题研究以 Python变成语言为基础,对学生行为数据进行分析,采用相关性分析对学生的行为和成绩进行分析,最后使用Echart可视化框架,结合FlaskWeb框架,展示可视化分析结果。
创新点:这一研究,不仅可以帮助辅导员、家长对学生行为状况进行监测和预警,亦可以帮助学校提供更加精准的教育服务和管理决策。
🥇 基于NLP的微博情感分析
数据集:爬取相关话题的微博数据
技术:通过综合应用Python技术、NLP模型、Flask框架
功能:对微博网站所采集到的相关信息及时进行清洗、筛选、分词以及分析。将分析过后的数据存储到数据库中。对分析过后的数据进行可视化展示,制作高频词汇的词云,方便用户更直观看出此时的热点,再利用NLP和贝叶斯进行微博言论的情感分析。
🥇 基于bp神经网络的房价预测系统
数据集:爬取58同城的二手房数据
技术Python技术、bp神经网络模型、Flask框架
功能:数据的爬取、预处理、分析、可视化。系统功能包括登录注册、房价数据展示、房价变化趋势、各区房价对比、房间数和朝向分析、房价预测等。
🥇 门店顾客口罩检测报警系统
数据集:戴口罩和不戴口罩的图像数据集
技术:PyTorch、MobileNetV2、Yolo、PyQt
功能:包括图像预处理、模型搭建、模型评估、GUI界面搭建等步骤,为用户提供视频上传功能,采用Python技术搭建页面,帮助门店将未戴口罩的人群进行识别和报警。
创新点:本选题将探索一种基于深度学习的人脸口罩识别算法,以用于快速自动识别人群是否佩戴口罩。该项人脸口罩识别算法将有效降低公共场所检查是否佩戴口罩时病毒传播的风险,即有利于提高检查速度与效率、降低人力成本。
🥇 基于机器学习的汽车销量预测
数据集:爬取的汽车数据以及获取的经济相关数据,
技术:Sklearn、Flask、逻辑回归算法
功能:根据国内生产总值当季值、汽油价格、人民币贷款基准利率、汽车总产量、公路里程数、汽车整车股票指数、消费者信心指数等来预测汽车销量,并展示汽车销量数据的可视化结果。
🥇 基于人脸识别的课堂签到系统
数据集:通过摄像头采集人脸数据
技术:OpenCV、TensorFlow、CNN、Flask
功能:课堂签到系统共分为模型训练和页面展示两个模块,在模型训练部分主要是对图像进行采集、预处理和对神经网络模型进行搭建。在页面展示部分主要分为登陆注册、人脸识别签到、签到结果展示、人脸图像录入、用户人脸信息管理、签到记录管理等模块。
🥇 基于人脸识别的门禁系统的设计与实现
数据集:通过摄像头采集人脸数据
技术:OpenCV、TensorFlow、CNN、Flask
功能:门禁系统共分为模型训练和页面展示两个模块,在模型训练部分主要是对图像进行采集、预处理和对神经网络模型进行搭建。在页面展示部分主要分为登陆注册、人脸识别门禁、识别结果展示、人脸图像录入、用户人脸信息管理、识别记录管理以及数据可视化等模块。
🥇 基于Python的信用卡客户历史数据分析与挖掘
数据集:公开数据集
技术:Python、Sklearn、Flask
功能:对获取到的数据集进行数据预处理,处理完其中的缺失值和异常值之后对数据进行进行描述性分析,分别运用SVM算法、决策树算法、KNN算法、随机森林算法建立信用卡。客户违约预测分类模型,通过ROC曲线、混淆矩阵等方法得到模型预测的准确率。
🥇 闯红灯行人识别报警系统设计实现
数据集:行人数据集、红灯数据集
技术:OpenCV、MobileNetV2、Yolo、PyQt
功能:上传视频、图像处理、模型准备、红绿灯识别、闯红灯报警
🥇 车牌识别系统设计实现
数据集:车牌字符数据集
技术:OpenCV、CNN、PyQt5
功能:车牌图像预处理、车牌位置选定、车牌定位、车牌字符分割、车牌识别:
🥇 肺炎医疗影像检测分类系统设计实现
数据集:肺炎图像数据集
技术:OpenCV、MobileNetV2、PyQt5
功能:数据获取、模型训练、图片上传、图片识别。
🥇 基于卷积神经网络的疲劳检测与预警系统的设计与实现
数据集:通过摄像头采集人脸数据
技术:OpenCV、TensorFlow、CNN
功能:视频采集模块,图像预处理模块,人脸识别(人脸定位、人眼定位、嘴部定位),疲劳程度判别模块,报警模块。
🥇 基于大数据的人肥胖程度预测分析与可控策略
数据集:来自UCI机器学习存储库,数据为墨西哥、秘鲁和哥伦比亚人的肥胖数据
技术:K-mean聚类、层次聚类和DBSCAN。以及三种常见的分类模型:Logistic回归、决策树模型、随机森林模型
功能:通过互联网资源对肥胖相关数据进行获取,对获取的数据进行清洗,然后对清洗后的具体数据进行数据挖掘,对不同肥胖程度进行分类建模,最后建立数据可视化模型,然后利用建立的模型对人的肥胖程度进行预测分析并给出合理的可控策略。
最后
🧿 选题指导, 项目分享:
https://gitee.com/yaa-dc/warehouse-1/blob/master/python/README.md