# 1 基于python的搜索引擎设计与实现
学长设计的系统目的是在信息处理分析的基础上,建立一个完整的中文搜索引擎。
搜索引擎有基本的五大模块分别是:
- 信息采集模块
- 信息处理模块
- 建立索引模块
- 查询和 web 交互模块
该系统主要由以下几个详细部分组成:
- 爬取数据
- 中文分词
- 相关度排序
- 建立web交互。
2 wifi室内定位算法设计与实现
wifi定位的本质实际上是基站式定位,是依靠wifi AP以自身为中心,向外辐射逐渐衰弱的指纹来进行定位的。
wifi定位方法基本上可以分为两大类:
不基于RSSI
- TOA(time ofarrival)
- TDOA(time difference of arrival)
- AOA(angle of arrival)
基于RSSI
在智能手机上,可以通过系统SDK获取到周围各个AP(Access Point)发送的信号强度RSSI及AP地址,利用RSSI来定位目前看来是最可行的方法,因此下面着重介绍,基于RSSI定位主要有两个算法:三角定位算法,指纹算法。
3 基于大数据的游数据分析可视化系统
采用Python爬虫技术对某大同市旅游景点数据进行采集,用Python中的Pandas库对采集到的数据进行整理, 首先将旅游数据转化成DataFrame格式, 再从多个维度和角度进行处理分析。
使用isnull函数选取查看缺失值占总数据百分比大于90%的列名及其数值, 认为它在数据分析中提供极其有限信息, 所以直接删除。对缺失数据采用fillna函数根据数据的不同类型进行了固定值填充, 异常值(也称为离群值)检测是一个重要的部分, 用duplicated函数表示重复行的布尔系列值, 返回缺失总数后进行去重。
采用选择(loc)、 分组(groupby)、 连接(merge)、 汇总统计(mean)等方法进行数据的统计与处理。处理完后利用其自带接口将数据存入到mysql数据库中。
4 基于机器视觉的车牌识别系统
基于openCV这个开源库,这意味着所有它的代码都可以轻易的获取。
能够识别中文,例如车牌为苏EUK722的图片,它可以准确地输出std:string类型的"苏EUK722"的结果。
识别率较高。目前情况下,字符识别已经可以达到90%以上的精度。
整体包含两个系统:
- 车牌检测
- 车牌字体识别(中文 + 数字 + 英文)
5 深度学习多目标跟踪实时检测
基于目标检测的跟踪,在视频每帧中先检测出来所有感兴趣的目标物体,然后将其与前一帧中检测出来的目标进行关联来实现跟踪的效果。
Step1:使用目标检测算法将每帧中感兴趣的目标检测出来,得到对应的(位置坐标, 分类, 可信度),假设检测到的目标数量为M;
Step2:通过某种方式将Step1中的检测结果与上一帧中的检测目标(假设上一帧检测目标数量为N)一一关联起来。换句话说,就是在M*N个Pair中找出最像似的Pair。