20个大数据毕设项目分享(二)

最新推荐文章于 2024-09-09 23:19:28 发布

noopier

最新推荐文章于 2024-09-09 23:19:28 发布

阅读量247

点赞数

文章标签： python

本文链接：https://blog.csdn.net/noopier/article/details/134181756

版权

# 1 基于python的搜索引擎设计与实现
学长设计的系统目的是在信息处理分析的基础上,建立一个完整的中文搜索引擎。
搜索引擎有基本的五大模块分别是：

信息采集模块
信息处理模块
建立索引模块
查询和 web 交互模块

该系统主要由以下几个详细部分组成：

爬取数据
中文分词
相关度排序
建立web交互。

2 wifi室内定位算法设计与实现

wifi定位的本质实际上是基站式定位，是依靠wifi AP以自身为中心，向外辐射逐渐衰弱的指纹来进行定位的。
wifi定位方法基本上可以分为两大类：
不基于RSSI

TOA（time ofarrival）
TDOA（time difference of arrival）
AOA（angle of arrival）

基于RSSI

在智能手机上，可以通过系统SDK获取到周围各个AP（Access Point）发送的信号强度RSSI及AP地址，利用RSSI来定位目前看来是最可行的方法，因此下面着重介绍,基于RSSI定位主要有两个算法：三角定位算法，指纹算法。

在这里插入图片描述

3 基于大数据的游数据分析可视化系统

采用Python爬虫技术对某大同市旅游景点数据进行采集，用Python中的Pandas库对采集到的数据进行整理, 首先将旅游数据转化成DataFrame格式, 再从多个维度和角度进行处理分析。

使用isnull函数选取查看缺失值占总数据百分比大于90%的列名及其数值, 认为它在数据分析中提供极其有限信息, 所以直接删除。对缺失数据采用fillna函数根据数据的不同类型进行了固定值填充, 异常值(也称为离群值)检测是一个重要的部分, 用duplicated函数表示重复行的布尔系列值, 返回缺失总数后进行去重。

采用选择(loc)、分组(groupby)、连接(merge)、汇总统计(mean)等方法进行数据的统计与处理。处理完后利用其自带接口将数据存入到mysql数据库中。

在这里插入图片描述

4 基于机器视觉的车牌识别系统

基于openCV这个开源库，这意味着所有它的代码都可以轻易的获取。
能够识别中文，例如车牌为苏EUK722的图片，它可以准确地输出std:string类型的"苏EUK722"的结果。
识别率较高。目前情况下，字符识别已经可以达到90%以上的精度。

整体包含两个系统:

车牌检测
车牌字体识别(中文 + 数字 + 英文)

在这里插入图片描述

5 深度学习多目标跟踪实时检测

基于目标检测的跟踪，在视频每帧中先检测出来所有感兴趣的目标物体，然后将其与前一帧中检测出来的目标进行关联来实现跟踪的效果。
Step1：使用目标检测算法将每帧中感兴趣的目标检测出来，得到对应的(位置坐标, 分类, 可信度)，假设检测到的目标数量为M；
Step2：通过某种方式将Step1中的检测结果与上一帧中的检测目标(假设上一帧检测目标数量为N)一一关联起来。换句话说，就是在M*N个Pair中找出最像似的Pair。
在这里插入图片描述