专业课相关
文章平均质量分 79
记录所有专业课内容
zstar-_
西电在读硕士生,联系邮箱:zstar1003@163.com
展开
-
JetBot手势识别实验
本实验目的在JetBot智能小车实现手势识别功能,使用板卡为Jetson Nano。通过小车摄像头,识别五个不同的手势,实现小车的运动及灯光控制。原创 2024-04-25 23:43:07 · 1562 阅读 · 1 评论 -
【进化计算】遗传算法求解gr48数据集
数据集选用TspLIB中的gr48。注:数据集中包含每一组的最优解和最优解城市编码。st70 : 675。原创 2023-10-23 11:50:17 · 397 阅读 · 0 评论 -
【目标检测】YOLOv5跑通VOC2007数据集
如果经常阅读我博客的读者,想必对YOLOv5并不陌生。在Pytorch:YOLO-v5目标检测(上)一文中,我使用了coco128数据集,非常轻松的跑通了。然而在使用VOC2007数据集时,却遇到重重阻碍。主要问题在数据标签转化这个阶段,VOC数据集标注形式是xml,需要将其转换为txt。很多博文并未把文件的放置位置交代清楚,导致走了不少弯路,本篇博文就记录如何不走弯路地跑通VOC数据集。我是用的VOC数据集是VOC2007,它的文件格式长这样:注:官网上下载的话训练验集和测试集是分成两个压缩包和,此处原创 2022-07-07 01:03:09 · 7709 阅读 · 24 评论 -
【数据挖掘】视觉模式挖掘:Hog特征+余弦相似度/k-means聚类
本次实验使用的是VOC2012数据集,首先从图像中随机采样图像块,然后利用Hog方法提取图像块特征,最后采用余弦相似度和k-means聚类两种方法来挖掘视觉模式。本次实验使用VOC2012数据集。VOC2012数据集常用于目标检测、图像分割、网络对比实验和模型效果评价。对于图像分割任务,VOC2012的训练验证集包含了2007-2011年的所有对应图像,包含有2913张图片和6929个目标,测试集只包含了2008-2011年。由于该数据集多用于目标检测等任务中,因此在本次实验中,仅使用到该数据集中的8类数原创 2022-07-06 18:00:04 · 2472 阅读 · 8 评论 -
【深度学习】语义分割实验:Unet网络/MSRC2数据集
把图片数据从文件夹整理成csv文件,每一行代表其路径2.数据预处理颜色与分类标签的转换语义分割主要是构建一个颜色图(colormap),对每一类分割的对象分别给予不同的颜色标注。图片裁剪3.数据加载4.Unet 网络结构下采样上采样输出整体结构5.评估指标:MIoU6.训练7.测试理论上,应该用测试集进行测试,但测试的结果惨不忍观。可能是由于训练次数不足导致,在上面这段代码中,直接导入训练集进行查看,下面是和GroundTruth进行对比参照图。实验源码+原创 2022-07-05 11:39:17 · 2346 阅读 · 0 评论 -
【深度学习】图像超分实验:SRCNN/FSRCNN
输入大小为h×w的图像X,输出为一个sh×sw的图像 Y,s为放大倍数。本次实验采用的是 BSDS500 数据集,其中训练集包含 200 张图像,验证集包含 100 张图像,测试集包含 200 张图像。数据集来源:https://download.csdn.net/download/weixin_42028424/11045313数据预处理包含两个步骤:(1)将图片转换成YCbCr模式由于RGB颜色模式色调、色度、饱和度三者混在一起难以分开,因此将其转换成 YcbCr 颜色模式,Y是指亮度分量,Cb表示原创 2022-07-05 10:46:56 · 5722 阅读 · 1 评论 -
【数据挖掘】任务6:DBSCAN聚类
编程实现DBSCAN对下列数据的聚类数据获取:https://download.csdn.net/download/qq1198768105/85865302DBSCAN 聚类参数说明eps:ϵ-邻域的距离阈值,和样本距离超过ϵ的样本点不在ϵ-邻域内,默认值是0.5。min_samples:形成高密度区域的最小点数。作为核心点的话邻域(即以其为圆心,eps为半径的圆,含圆上的点)中的最小样本数(包括点本身)。若y=-1,则为异常点由于DBSCAN生成的类别不确定,因此定义一个函数用来筛选出符合指定类别原创 2022-07-02 22:43:03 · 1411 阅读 · 0 评论 -
【数据挖掘】任务5:K-means/DBSCAN聚类:双层正方形
编程如下数据聚类:双层正方形生成双层正方形数据K-Means 聚类参数说明n_clusters:聚类个数random_state:控制参数随机性eps:ϵ-邻域的距离阈值,和样本距离超过ϵ的样本点不在ϵ-邻域内,默认值是0.5。min_samples:形成高密度区域的最小点数。作为核心点的话邻域(即以其为圆心,eps为半径的圆,含圆上的点)中的最小样本数(包括点本身)。若y=-1,则为异常点。由于DBSCAN生成的类别不确定,因此定义一个函数用来筛选出符合指定类别的最合适的参数。合适的标准是原创 2022-07-02 17:22:06 · 633 阅读 · 0 评论 -
【数据挖掘】任务4:20Newsgroups聚类
根据20Newsgroups数据集进行聚类,将聚类结果显示给用户,用户可以选择其中的一个类,标为关注,类的关键词作为主题,用户就可以跟踪这主题、了解主题的文章内容。数据获取使用sklearn的fetch_20newsgroups下载数据数据预览可以看到,新闻数据共有20个分类对各类别的数量进行可视化处理为了提升聚类的准确性,在聚类之前先对数据进行预处理,剔除数据中的数字和标点,并将大写字母转换成小写处理后的数据部分展示K-means聚类使用K-means聚类方法,将数据聚成20类原创 2022-07-02 15:31:28 · 1458 阅读 · 0 评论 -
【数据挖掘】任务3:决策树分类
要求:天气因素有温度、湿度和刮风等,通过给出数据,使用决策树算法学习分类,输出一个人是运动和不运动与天气之间的规则树。训练集和测试集可以自由定义,另外需要对温度和湿度进行概化,将数值变为概括性表述,比如温度热,温,凉爽,湿度变为高,中。数据预处理数据读取 天气 温度 湿度 风况 运动 0 晴 85 85 无原创 2022-07-02 15:24:54 · 1759 阅读 · 0 评论 -
【数据挖掘】任务2:医学数据库MIMIC-III数据处理
本次任务的目的是处理PO2,PCO2两个指标。这两个指标均为病人的血气指标,以一定的时间间隔采集。一个病人一次住院期间可能收集一次或者多次。要求,按照采集时间的前后顺序,汇总每个病人每次住院期间的所有的pO2, pCO2指标值。涉及到的预处理方法包括插值,去噪,缺失值填充,离群点数据处理,可视化等。patients:包含所有患者数据。chart_events:包含了所有可供患者使用的图表数据。在他们的ICU停留期间,病人信息的主要存储库是他们的电子图表。电子图表显示病人的日常生命体征和与他们的护理有关的任何原创 2022-07-02 12:48:23 · 4373 阅读 · 7 评论 -
【数据挖掘】任务1:距离计算
给定两个被元组(22,1,42,10)和(20,0,36,8)表示的对象(a)计算这两个对象之间的欧几里得距离;(b)计算这两个对象之间的曼哈顿距离;(c)使用q=3,计算这两个对象之间的闵可夫斯基距离(d)计算着两个对象之间的上确界距离欧氏距离曼哈顿距离闵可夫斯基距离上确界距离...原创 2022-07-02 10:25:25 · 5184 阅读 · 0 评论 -
【计算机视觉】数字图像处理基础知识题
1、产生下图所示亮块图像 f1(x,y)(128×128大小,暗处=0,亮处=255),对其进行FFT。(1)同屏显示原图f1和FFT(f1)的幅度谱图;(2)若令f2(x,y)=(-1)x+y f1(x,y),重复以上过程,比较二者幅度谱的异同,简述理由;(3)若将f2(x,y)顺时针旋转45度得到f3(x,y),试显示FFT(f3)的幅度谱,并与FFT(f2)的幅度谱进行比较。(1) 原图f1和FFT(f1)的幅度谱图如图1所示(2) 令f2(x,y)=(−1)(x+y)f1(x,y)f2(原创 2022-06-30 19:14:06 · 3120 阅读 · 4 评论 -
【NLP】自然语言处理学习笔记(三)语音合成
本笔记参考的课程是李宏毅老师的自然语言处理课程Link:https://aistudio.baidu.com/aistudio/education/lessonvideo/1000466语音合成(TTS)指的是将文字信息转换成语音信息,这在各种自媒体工具上非常常见。在端到端的模型出现之前,已经有人将深度学习应用在了语音合成之中。下图中展示了Deep Voice初代结构,它用了四个模型。首先,它将输入的文本信息(text)输入到Grapheme-to-phoneme转化成音位(phoneme),然后分原创 2022-06-19 16:28:21 · 2670 阅读 · 4 评论 -
【NLP】自然语言处理学习笔记(二)语音转换
本笔记参考的课程是李宏毅老师的自然语言处理课程Link:https://aistudio.baidu.com/aistudio/education/lessonvideo/1000466什么是语音转换?语音转换就是将一段语音转换成另一段语音,内容保持不变。比如,最常见的应用是变声器。此外,也可以实现语音降噪,语音加噪等其它应用场景。语音数据可分为两个种类:Parallel Data和Unparallel DataParallel Data即一对对的数据集,两段相同内容的语音由不同音源来发出。Un原创 2022-06-18 00:59:19 · 1871 阅读 · 1 评论 -
【NLP】自然语言处理学习笔记(一)语音识别
本笔记参考的课程是李宏毅老师的自然语言处理课程Link:https://aistudio.baidu.com/aistudio/education/lessonvideo/1000466Token是模型的输出形式,以上图语音识别为例,输出的text包含了N个Token,每个Token有V种符号目前,Token主要有下面五种具体形式:Phoneme音标,即语言的发音。如果想要换算成文本,需要有个Lexicon(词典表),例如cat ⟶ K AE TGrapheme字母最直接的形式,总数为26个字原创 2022-06-16 17:21:07 · 4333 阅读 · 1 评论 -
【目标检测】 R-CNN/FPN/YOLO经典算法梳理
本书简单梳理目标检测的一些算法,适合初入该领域的读者了解学习。原创 2022-06-13 17:57:23 · 960 阅读 · 0 评论 -
【计算机视觉】基础图像知识点整理
计算机视觉知识点整理原创 2022-06-08 22:43:13 · 1452 阅读 · 0 评论 -
【特征提取】Hog特征原理简介与代码实践
前言在【模式识别】SVM实现人脸表情分类一文中,我曾使用Hog特征+SVM的方式实现表情分类,但对于Hog特征的原理并未做深入整理。此篇将结合scikit-image来简单分析Hog特征的原理和维度关系。因为没看过原论文,因此自己的理解可能会有偏差,如有错误,欢迎评论区指正。图像梯度在进入到Hog之前,需要先了解图像中梯度的概念。以下图为例(图源:[1]),黑色像素点值为0,白色像素点值为1,分别求X方向梯度和Y方向梯度,从后两幅图可以看出,当箭头从0突变到1时,梯度为正值,图像中以白色边缘表示,反原创 2022-05-19 15:37:36 · 3428 阅读 · 3 评论 -
【深度学习】MLP/LeNet/AlexNet/GoogLeNet/ResNet在三个不同数据集上的分类效果实践
本文使用了MLP/LeNet/AlexNet/GoogLeNet/ResNet五个深度神经网络模型结构,在MNIST、Fashion MNIST、HWDB1三个不同的数据集上进行了实验。原创 2022-05-02 11:19:08 · 2214 阅读 · 0 评论 -
【汇编】微机原理与接口技术课程设计
本文是微机原理与接口技术课程设计完整的程序和实验报告可在此处下载:https://gitee.com/zstar1003/xdu-homework/tree/master/%E5%BE%AE%E6%9C%BA%E5%8E%9F%E7%90%86一、题目要求编写程序实现下列5项功能,通过从键盘输入1~5进行菜单式选择。(1) 按数字键“1”,完成将字符串中的小写字母变换成大写字母。用户输入由英文大小写字母或数字0~9组成的字符串(以回车结束),变换后按下列格式在屏幕上显示:<原字符串>.原创 2022-05-02 01:16:37 · 8463 阅读 · 8 评论 -
【FPGA】课程设计:简单计时器闹钟
本文是EDA实验的课程设计完整源码和实验报告可从此处下载:https://gitee.com/zstar1003/xdu-homework/tree/master/EDA%E5%AE%9E%E9%AA%8C一、实验目的设计一个电子闹钟。要求电路上电后自动计时,到达预置的闹响时刻后,由蜂鸣器发出音乐报警。闹响时刻可利用按键设置,设置范围0~999999。此次实验除了满足上述基本功能外,额外添置了流水灯功能,当到达预置的闹响时刻后,不仅蜂鸣器会发出音乐报警,并且LED会形成流水灯。二、实验环境2.原创 2022-05-02 01:04:03 · 12355 阅读 · 11 评论 -
【智能控制导论】雪堆博弈-最小节点覆盖问题
本篇博文是智能控制导论专业课的实验报告完整的程序和文档下载地址:https://download.csdn.net/download/qq1198768105/85259200问题描述验证结论:当雪堆博弈满足r<1/kmax时(kmax为网络节点的最大度),网络博弈的纳什均衡中的采用合作策略的节点构成极小节点覆盖。网络结构可自定,节点数目不少于10。节点的初始状态可随机定为Cooperator或者Defector,按照某种给定顺序(例如1,2,…,10)依次检查每个节点,是否改变其状态可以.原创 2022-05-02 00:47:38 · 1683 阅读 · 0 评论 -
【FPGA实验】按键控制流水灯
配置选择上篇【FPGA实验】流水灯实验记录了如何上手FPGA,实现简单的流水灯效果,本篇将稍微升级一些,通过按钮实现多种形态的流水灯。此次仍使用正点原子的开拓者FPGA开发板,配置和上篇一致。功能描述按键1按下时,从右向左的流水灯效果;按键2按下时,从左向右的流水灯效果;按键3按下时,LED闪烁;按键4按下时,LED全亮;无按键按下时,LED熄灭 ;verilog代码先贴官方给的例程代码:module flow_light( input sys_clk原创 2021-10-27 22:41:52 · 17482 阅读 · 2 评论 -
【FPGA实验】蜂鸣器
正点原子开拓者FPGA开发板上自带了一枚无源蜂鸣器,本篇将记录如何通过按键来控制蜂鸣器的开关。功能描述初始蜂鸣器不响,按键按一下蜂鸣器开始响,再按一下蜂鸣器停止。模块结构本次采用了三个模块,一个顶层模块,一个按键消抖模块和蜂鸣器控制面模块。按键消抖消抖,即消除抖动。若不消除抖动,则显得过于灵敏,在短时间内会多次反复触发。思路:每次按下给予20ms的延时,若这段时间内状态不变,则输出,否则重新计时。模块名:key_debounce.vmodule key_debounce( .原创 2021-10-28 01:11:12 · 4747 阅读 · 0 评论 -
【FPGA实验】数码管静态显示
数码管动态显示位选信号–控制哪个数码管显示段选信号–控制数码管显示内容原创 2021-10-29 10:05:47 · 1981 阅读 · 3 评论 -
【FPGA实验】数码管动态显示
开拓者FPGA开发板上有六个共阳极八段数码管,本实验将完成数码管动态显示。数码管动态/静态显示区别静态显示:每一个管脚都用固定的一个电平去控制。优点:能够做到”同时”缺点:管脚太多动态显示:每一个数码管共用一套电路,显示时只需控制哪一个数码管进行显示。优点:大大减小了管脚的数量缺点:一次只能控制单独一个数码管进行显示,但可以快速切换数码管显示,利用人眼的”视觉暂留"来“同步”进行显示。功能描述动态控制数码管,使其每1ms从0开始累加1,按下复位键后重新开始计数。计数模块先通.原创 2021-10-29 22:20:01 · 7363 阅读 · 1 评论 -
【汇编】速查手册
DOS系统功能调用调用形式::MOV AH, 01HINT 21HAH功能调用参数返回参数0程序终止(同INT 20H)CS=程序段前缀1键盘输入并回显AL=输入字符2显示输出DL=输出字符3异步通迅输入AL=输入数据4异步通迅输出DL=输出数据5打印机输出DL=输出字符6直接控制台I/ODL=FF(输入)AL=输入字符DL=字符(输出)7键盘输入(无回显)AL=输入字符原创 2021-11-18 17:40:22 · 1355 阅读 · 0 评论 -
【模式识别】实验二:K近邻算法(KNN)
KNN是模式识别中的经典算法,本次实验就MNIST数据集来做KNN算法的实验,并结合前一次的LDA降维对数据进行进一步处理。实验报告图片版pdf版本可以戳这:模式识别实验报告:KNN K近邻算法关键代码KNN原理报告里有写,不作重复赘述。本实验使用的编程环境是Jupyter,完整的程序代码可以戳这下载。【模式识别】实验二:KNN,python程序代码与实验过程这里仅贴上核心代码MNIST数据集的导入在本专栏之前一篇博文专门分析过,这里只上代码:mnist = fetch_openm.原创 2021-11-09 21:57:04 · 4279 阅读 · 3 评论 -
【模式识别】实验一:Fisher线性判别(LDA)
Fisher线性判别也叫作LDA,它可用于降维也可用于分类,当维度降低成1维时,确定一个阈值,即可实现分类。和PCA相比,LDA是一种有监督的降维算法,局限性在于降低的维度必须小于样本类别数-1。LDA分类的核心思想是将样本的向量空间投射到一个一维直线上,使样本类内离散度尽可能小,类间离散度尽可能大。本实验通过sonar和Iris数据集,实现了三种不同方式的分类算法,并在sonar数据集上选取了部分特征,考察了特征数和分类精确度之间的关系。pdf版的实验报告可以戳这:https://download.c.原创 2021-10-24 23:48:18 · 5169 阅读 · 9 评论 -
【模式识别】实验三:K均值算法和模糊C均值算法
本文主要介绍K-means和FCM聚类算法的区别与应用原创 2021-12-26 18:27:47 · 2489 阅读 · 1 评论 -
【认知计算】Deepfake/Anti-deepfake综述探究
Deepfake原创 2022-04-18 15:35:02 · 5414 阅读 · 0 评论 -
【模式识别】SVM实现人脸表情分类
前言本文是模式识别课程关于支持向量机(SVM)算法的课程设计,根据人脸的面部特征,通过SVM算法将表情分为7类。本文的jupyter文件和数据集下载地址:https://download.csdn.net/download/qq1198768105/66912662数据集本文采用的数据集为The Japanese Female Facial Expression (JAFFE) Dataset数据集来源:https://zenodo.org/record/3451524#.YaeJztBByUl原创 2021-12-19 20:53:21 · 4684 阅读 · 3 评论