自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(18)
  • 资源 (3)
  • 收藏
  • 关注

原创 Ubuntu20 VSCode 每次修改文件时提示需要超级管理员权限的问题

Ubuntu20 VS Code 每次修改文件时提示需要超级管理员权限问题修改文件夹所有权修改文件夹所有权 sudo chown -R mike my-app分解以下命令sudo –使用管理员权限,处理属于另一个用户的文件夹chown –更改所有权的指令-R –确保所有子对象都具有相同所有权更改mike –新所有者my-app –要修改的文件夹...

2021-12-14 11:47:52 2172 1

原创 PyTorch踩坑指南(1)nn.BatchNorm2d()函数

前言最近在研究深度学习中图像数据处理的细节,基于的平台是PyTorch。心血来潮,总结一下,好记性不如烂笔头。Batch Normalization对于2015年出现的Batch Normalization1,2018年的文章Group Normalization2在Abstract中总结得言简意赅,我直接copy过来。Batch Normalization (BN) is a mile...

2020-04-16 14:46:50 23400 40

原创 相机焦距与视场角

相机焦距与视场角固定焦距镜头(Fixed Focal Length Lens),是指具有固定视场角(AFOV)的透镜。传感器大小已知假设图像传感器的水平维度(horizontal dimension)即宽度为hhh,镜头焦距(Focal Length,fff)与视场角(angular Field of View,以度°°°为单位)关系如下图1所示,水平视场角计算如下。AFOVH[°]=2...

2020-03-11 12:44:05 9124 4

原创 声纹识别-2.GMM-UBM(高斯混合模型-通用背景模型)

声纹识别-2.GMM-UBM(高斯混合模型-通用背景模型)前言声纹识别-1.绪论中回顾了声纹识别的类别,性能评价指标和算法。本篇博文介绍声纹识别算法中较为传统的GMM-UBM(Gaussian Mixture Model-Universal Background Model)算法1 2。GMM-UBM算法需从GMM说起,因为UBM实际上也是GMM,之所以它叫通用背景模型是因为它是从背景数据(...

2020-01-08 20:15:12 8849 11

原创 利用PyTorch C++ API(LibTorch)加载预训练模型及预测

利用PyTorch C++ API(LibTorch)加载预训练模型及预测前言The LibTorch distribution encompasses a collection of shared libraries, header files and CMake build configuration files. While CMake is not a requirement for ...

2019-12-23 19:01:11 11095 23

原创 PyTorch踩坑指南(2)损失函数nn.NLLLoss()和nn.CrossEntropyLoss()

前言深度学习模型优化,即优化网络权值使得该模型拟合数据的能力达到最优,而最优的一个标准是损失函数较小(兼顾训练数据和测试数据,以及实际应用场景的最优)。PyTorch中有很多损失函数,这里我主要介绍最常用的两种,NLLLoss和CrossEntropyLoss;而实际上CrossEntropyLoss更常用,NLLLoss与其的关系也会在本文中详细介绍。Softmax要介绍上述两个损失函数的关系,得先从Softmax说起。Softmax函数是一个非线性转换函数,通常用在网络输出的最后一层,Softma

2021-06-25 18:46:21 1851 3

原创 相机标定(1)——四个坐标系

前言二维图像能提供丰富的环境信息或空间信息,这些信息涵盖(1)图像上每一点的亮度与物体某个表面点的反射光的强度的关系(2)图像点在图像平面上的位置与a.相机与空间物体的相对方位的关系 与b.相机的内部结构关系空间物体表面某点的三维几何位置与其在图像中对应点之间的相互关系,三维计算机视觉的主要任务是利用三维物体的二维图像所包含的信息,获取三维物体的空间位置与形状等几何信息,并在此基础上识别三维物体1;而在SLAM(simultaneous localization and mapping )场景中,二维图

2021-01-26 20:12:42 14344 15

原创 手眼标定eye-in-hand(一)AX=XB方程推导

1. 前言本文主要介绍eye-in-hand的手眼标定,引用OpenCV的文档原话和原图1:“The following picture describes the Hand-Eye calibration problem where the transformation between a camera (“eye”) mounted on a robot gripper (“hand”) has to be estimated.”2. 手眼标定方程推导step 0. 符号描述与目标介绍如上图所

2021-01-19 18:11:09 2038 1

原创 OpenCV-Python笔记(0)安装opencv-python

前言基于python环境的opencv简单易用,方便算法验证。当然安装也比较简单。安装pip install opencv-python或者pip3 install opencv-python假如你嫌弃安装速度比较慢,那可以临时使用(也可永久添加,自行搜索)清华的镜像。pip3 install opencv-python -i https://mirror.tuna.tsinghua.edu.cn/simple安装成功python>>>import cv2&gt

2020-11-10 18:32:01 135

原创 Python批量重命名文件(图片文件为例)

批量重命名图片文件使用Python自带的os包,就可以利用其中的**rename()**函数对文件进行重命名。对于深度学习素材来讲,图片素材可能来自不同的途径,其原始文件名千差万别(有时文件格式也有所不同)。本文讲一下如何针对其中的图片文件——结合使用**endswith()**判定文件名,如".png",".jpg"等——进行重命名。至于图片格式的转换大家可结合OpenCV-Python中的相关操作自行处理,以达到文件名和文件格式的统一。Show me the codesimport osd

2020-09-16 14:35:19 483

原创 OpenCV-Python笔记(2)视频文件分帧并保存

创建解析视频文件对象要解析视频,需创建一个VideoCapture()对象,它的参数设为视频文件的名称。创建对象后,使用read()函数逐帧捕捉。最后需要释放对象。保存帧使用cv2.imwrite()函数可以保存视频帧为图像,保存格式可以多样,如jpg,png等。Show me the codesimport cv2import osobjectPath = './images/'if not os.path.exists(objectPath): # creat directory to

2020-07-09 19:37:55 479

原创 单目摄像头测距

1. 前言随着自动驾驶的发展,现代汽车的智能化程度逐步提高,基于视觉系统的自动驾驶也逐步趋于稳定——特斯拉、Mobileye、CommaAI等机构起着推波助澜的作用。自动驾驶场景或者Adas场景中,当检测出前方车辆后通常需要进行距离估计,为车辆控制提供距离参考信息;而基于视觉的移动机器人也存在该需求。单目摄像头光学图像测距具有低成本和计算快的优点,主要有两种常用的测距方式1。使用目标物体大...

2020-05-01 00:31:27 5095 3

原创 声纹识别-3.i-vector/PLDA(上篇)

声纹识别-3.i-vector/PLDA前言前面两篇博文分别介绍了声纹识别的绪论和传统的GMM-UBM声纹识别算法。本文介绍,到目前为止,在声纹识别领域仍具有很大影响力的i-vector1/PLDA2(identification vector, Probabilistic Linear Discriminant Analysis,辨识向量,概率线性判别分析)。i-vector是代表说话人的向...

2020-04-16 19:48:02 2495 3

原创 OpenCV-Python笔记(1)从摄像头中获取视频并保存

从摄像头捕获视频要捕捉视频,需创建一个VideoCapture()对象,它的参数可以是设备索引或视频文件的名称。设备索引指定摄像头编号。0代表第一个摄像头、1代表第二个,以此类推。创建对象后,使用read()函数逐帧捕捉视频。最后需要释放对象。保存视频要保存视频,需创建一个VideoWriter()对象,指定输出文件名(例如:output.avi)。之后指定FourCC代码——FourCC是...

2020-04-01 16:53:30 1130

原创 随机抽样一致(RANSAC,Random Sample Consensus)

随机抽样一致(RANSAC,Random Sample Consensus)前言随机采样一致(RANSAC)是一种迭代方法,可从一组包含离群值(outliers)的观察数据中估计数学模型的参数,不使离群值对估计值产生影响。因此,它也可以解释为离群值检测方法。从某种意义上说,它是一种非确定性算法,以一定的概率产生合理的结果,且随着迭代次数的增加,该概率增加。RANSAC由Fischler和Bol...

2020-03-26 20:50:38 1209

原创 声纹识别-1.绪论

声纹识别-1.绪论前言指纹信息、人脸信息和声纹(voice-print)信息作为人体固有的生物信息,是智能电子设备私有化部署及辅助辨认个体的媒介。目前,指纹和(3D)人脸作为智能电子设备解锁信息已经成功商用,典型的设备如智能手机、人脸打卡系统等。声纹因为其变化性较前两者强,如感冒和外界环境声音干扰,商用化步伐不如前两者。据悉,目前声纹满足安全性级别、作为个体生物信息解锁和认证媒介的应用是在金融...

2020-01-01 23:54:28 1637

原创 Ubuntu 18.04 LTS 安装OpenCV (C/C++)

Ubuntu 18.04 LTS 安装OpenCV (C/C++)前言OpenCV提供开源图像算法和机器学习算法,是计算机视觉中使用极广的图像处理算法库。OpenCV最早由Intel创建,OpenCV实际上表示Intel® Open Source Computer Vision Library,之后由Willow Garage(2014年关闭)和Itseez(2016年被Intel收购)支持和...

2019-12-19 19:32:35 10186 2

原创 Reinforcement Learning: An Introduction second edition, Richard S. Sutton and Andrew G. Barto

强化学习完整版PDF及Code官方下载地址链接: Second Edition MIT Press, Cambridge, MA, 2018.请为我点赞 !-_-!

2019-02-26 11:53:36 2063

MS说话人识别工具包(MSR identity toolkit).7z

微软开源说话人识别matlab代码工具包

2021-12-06

RANSAC直线拟合python代码

SciPy Cookbook中的RANSAC样例,简单易懂,直观理解RANSAC拟合直线的过程。1. 选取部分数据点 2. 最小二乘法拟合直线 3. 判定inliners 4. 终止条件

2020-03-30

Regression.pdf

介绍常用的数据回归方法,如Linear Regression,kNN Regression等,主要是利用其随机采样一致的算法流程和示意图,支持博客写作。

2020-03-26

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除