- 博客(25)
- 收藏
- 关注
转载 v4l2接口,结构图
文章目录v4l2接口种类v4l2 设备节点数据结构及指令v4l2框架结构及关系v4l2 结构图(UML)v4l2 拓扑图参考:https://zhuanlan.zhihu.com/p/105548113《android驱动开发权威指南》YellowMax2001 https://blog.csdn.net/u013904227/category_9277668.htmllinux Kernel source code: 4.4简介v4l2接口种类 V4L2在设计时,是要支持很多广泛的设
2021-03-30 15:22:51 1005
转载 摄像头自动曝光,自动对焦,自动白平衡,ISP,图像处理及色彩模型,色彩空间
文章目录2.1 AE(Auto Exposure)自动曝光2.2 AF(Auto Focus) 自动对焦2.3 AWB(Auto White Balance) 自动白平衡2.4 ISP(Image Signal Process)3. 色彩模型3.3 色彩空间4. 图像格式及转换4.2 RGB,YUV颜色编码常见的基于 YUV 4:2:2 采样的格式如下表:常见的基于 YUV 4:2:0 采样的格式如下表:4.5.1 基于YUV 4:2:2采样的格式参考链接:1.凹凸思 https://www.zhihu
2021-03-30 14:46:49 9726 1
转载 matlab使用webcam获取摄像头图像,camList = webcamlist
https://blog.csdn.net/firing00/article/details/80581313安装驱动https://blog.csdn.net/zzx2016zzx/article/details/82725712使用的是matlab2016a版本,摄像头驱动需提前下载安装1在循环中获取单个图像本例显示如何使用快照功能从USB摄像头获取实时图像。用于USB摄像头的MATLAB®支持包可将任何符合USB视频类(UVC)的网络摄像头的实时图像带入MATLAB®。识别可用的摄像头w
2021-03-30 14:24:33 1966
转载 Camera摄像头模组硬件
1. 简介摄像头模组,全称CameraCompact Module,简写为CCM。CCM 包含四大件: 镜头(lens)、传感器(sensor)、软板(FPC)、图像处理芯片(DSP)。决定一个摄像头好坏的重要部件是:镜头(lens)、图像处理芯片 (DSP)、传感器(sensor)。CCM的关键技术为:光学设计技术、非球面镜制作技术、光学镀膜技术。工作原理:物体通过镜头(lens)聚集的光,通过CMOS或CCD集成电路,把光信号转换成电信号,再经过内部图像处理器(ISP)转换成数字图像信号输出到数字
2021-03-30 14:22:14 4984
转载 模拟高清和数字高清摄像机的区别,全局快门CMOS 图像传感器,Interline Transfer CCD图像传感器
一、视频处理不同:模拟高清摄像机输出模拟视频信号到后端DVR等设备。DVR通过最前端的DOCODE(采集芯片)将模拟信号转成数字信号,首先得到的是half D1分辨率画面, 再进行压缩后得到CIF画面。数字摄像机采用逐行扫描,后端是完整的一帧接一帧图象接受。数字高清摄像机最后输出给后端混合DVR\PDVR\NVR\PC电脑的是已经压缩过的数字视频,不需要视频采集芯片进行A/D转换,直接由后端设备存储起来,不需要占用CPU或DSP资源去压缩视频,从而节省了处理器资源,减低了对后端设备的配置要求。二、视频
2021-03-19 17:17:40 2536
转载 【Jetson TX2(4)】NVIDIA平台Xavier/TX2板相机视频输入方案
学习大佬的文章 :https://blog.csdn.net/jzwjzw19900922/category_9147221.html文章目录相机概述Camera系统 & Fpdlink相机概述FPDLink接口相机方案选择FPDLink接口相机同步方案模拟相机视频输入方案-----模拟转MIPI /DVP方案4&6路模拟相机输入TP2850方案开发TI954解串器功能分析相机概述一. 概述各种方案的选择以及相机的选型不太了解,导致方案会走偏,确实这其中确实涉及的图像接口、协议、信
2021-03-19 17:04:22 7639 3
转载 TX2 摄像头CSI(一)
最近发现不少Jetson TX2用户都在考虑如何选择相机,尤其是关于CSI相机。Lady我在网上找到一篇不错的文章,来自于一位软件工程师,分享给大家https://cloud.tencent.com/developer/article/1151984在本文里,他将重点告诉大家:为什么用CSI相机如果您希望获得最佳性能(根据FPS,分辨率和CPU使用情况),或者需要对摄像机进行底层控制,并且您愿意支付一台摄像机,CSI摄像机应该是您的摄像机的主要选择这些功能的优质。我个人使用CSI相机,因为我需要高
2021-03-19 16:27:58 2057
转载 【摄影与图像】444,422,420,10bit,8bit,RGB,YCrCb,场序,h264编码,封装,码率,PR常用配置
技术序列的摄影255 这个数字,和8bit的关系RGB10bit 比8bit好视频HDR技术需要10bitRGB 与YCrCbRGB色彩可以转换成明度与色彩4444,422,420采样一个视频里面包含了什么?图像音频媒体配置信息封装格式分辨率标准帧率25场序由于过去电视带宽限制,无法直接逐行扫描,因此通过拼接基线数与偶线数实现成像方式。现在的条件下,已经实现直接逐行扫描成像,图像不用经过拼接这个步骤。场序设置为逐行扫描音频采样48Khz封装格式文件的后缀mp4 最佳,
2021-03-19 08:42:35 34721
转载 fp16和fp32,神经网络混合精度训练,PYTORCH 采用FP16,Libtorch采用FP16,神经网络混合精度三种避免损失,TensorRT模型转换及部署(一)
文章目录基础知识利用fp16 代替 fp32PYTORCH 采用FP16后的速度提升问题Libtorch采用FP16后的速度提升问题CPU上tensor不支持FP16tf 的调用如何在TensorRT上用半精度(FP16)对Caffemodel进行inference神经网络混合精度训练三种避免损失TensorRT模型转换及部署,FP32/FP16/INT8精度区分转换流程Parser如今支持:优化策略tensorRT 运行使用IExecutionContext进行推理的基本步骤:onnx使用python接口
2021-03-18 10:33:28 24856 3
转载 【Jetson TX2(10)】使用CAN 通信
can总线dbc载入通信程序Git源代码:https://github.com/energystoryhhl/LinuxCanbusTool。肯定是Linux系统,自带各种库,谷歌的TensorFlow,opencv啥的还有一些API比如比较重要的图像获取接口V4L2接口,等等。3、安装canbus模块(Linux将不常用的模块做成.ko文件,在需要使用时可以将其进行载入内核,降低系统的开销)TX2具有两个can设备,分别为can0和can1。这两个can设备自带can控制器,其原理图如下。
2021-03-11 15:34:12 2243
转载 小卷积核的特征图与卷积参数变化不大,计算量变化明显
https://www.cnblogs.com/missidiot/p/10174230.html小卷积核说到网络深度,这里就不得不提到卷积,虽然AlexNet有使用了11x11和5x5的大卷积,但大多数还是3x3卷积,对于stride=4的11x11的大卷积核,我认为在于一开始原图的尺寸很大因而冗余,最为原始的纹理细节的特征变化用大卷积核尽早捕捉到,后面的更深的层数害怕会丢失掉较大局部范围内的特征相关性,后面转而使用更多3x3的小卷积核(和一个5x5卷积)去捕捉细节变化。而VGGNet则清一色使用3
2021-03-08 17:26:21 1241
转载 【风格迁移】Neural Style Transfer 神经风格迁移
https://github.com/jm199504/VGG-NETNeural Style Transfer 神经风格迁移,是计算机视觉流行的一种算法,最先论文来源《 A Neural Algorithm of Artistic Style》所谓的图像风格迁移,是指利用算法学系著名画作的风格,将这个风格应用到我们自定义的图片上,其中著名的图像处理应用Prisma是用利用风格迁移技术,将普通人的照片自动转换为具有艺术气息风格的图片。将用到ImageNet VGG模型来图像风格迁移,其实VGGNet的
2021-03-08 17:11:18 633
转载 pytorh——Fully-connected
首先我们明白全连接层的组成如下 那么全连接层对模型影响参数就是三个:全接解层的总层数(长度)单个全连接层的神经元数(宽度)激活函数首先我们要明白激活函数的作用是:增加模型的非线性表达能力参考https://www.zhihu.com/question/41037974...
2021-03-08 15:41:15 2486
转载 pytorch ——torch.optim.Adam
class torch.optim.Adam(params, lr=0.001, betas=(0.9, 0.999), eps=1e-08, weight_decay=0)它在Adam: A Method for Stochastic Optimization中被提出。(https://arxiv.org/abs/1412.6980)参数:params (iterable) – 待优化参数的iterable或者是定义了参数组的dictlr (float, 可选) – 学习率(默认:1e-3)b
2021-03-06 16:00:52 7171
原创 【pytorch损失函数(2)】CrossEntropyLoss交叉熵CE
基于Pytorch实现,nn.CrossEntropyLoss(),是nn.logSoftmax()和nn.NLLLoss()的整合,可以直接使用它来替换网络中的这两个操作(此标准将LogSoftMax和NLLLoss集成到一个类中)。sigmoid对应的CE函数的反向传播就是在看我们预测值与真实值之间的差异,因此,sigmoid+CE也可以用于做数值的回归,因为反向传播本身,就是计算这两者的差异。x向量(预测)和目标分布(在错误类上为0,在正确类上为1的 one-hot 向量)表示。
2021-03-06 14:52:50 1926 1
转载 【熵】熵,KL散度,交叉熵,最大熵模型
https://blog.csdn.net/geter_CS/article/details/84572199文章目录熵条件熵最大熵模型熵熵在概率论中是很重要的概念。表示随机变量不确定性的度量。设随机变量 X其概率分布为P(X=xi)=pi,i=1,2...nP(X=x_i)=p_i,i=1,2...nP(X=xi)=pi,i=1,2...n,则 X 的熵可以表示为H(p)=−∑i=1npilog(pi)H(p)=-∑^n_{i=1}p_ilog(p_i)H(p)=−∑i=1n
2021-03-06 14:28:35 1037 1
转载 GCC的gcc和g++区别,本质而言,gcc和g++并不是编译器,也不是编译器的集合,它们只是一种驱动器,根据参数中要编译的文件的类型,调用对应的GUN编译器而已
https://www.cnblogs.com/samewang/p/4774180.html看的Linux公社的一篇文章,觉得不错,内容复制过来了。其实在这之前,我一直以为gcc和g++是一个东西,只是有两个不同的名字而已,今天在linux下编译一个c代码时出现了错误才找了一下gcc和g++的区别。先描述一下今天遇到的错误:因为以前写程序的时候,写的都是cpp文件,然后就直接使用g++编译,没出错,也就没有在意过这些问题,今天有一个c文件,但里面包含后STL中的vector语法,想着使用gcc来编
2021-03-05 09:24:56 139 1
转载 概率论与数理统计——贝塞尔校正(Bessel‘s Correction)
https://www.jianshu.com/p/8dbb2535407e在学习概率论与数理统计的相关知识时,大家肯定会听到”贝塞尔校正(Bessel’s Correction)“这个名词,这是德国天文学家,数学家Friedrich Bessel在进行天体测量学研究时提出的一个方法。可能大家看到一个以人名命名的概念就会觉得很难,其实这只是一个与统计学的方差和标准差相关的一个修正方法而已。下面我们来具体讲解一下。 首先列出几个熟悉的公式:依次是 总体标准差(standard deviati
2021-03-04 14:33:12 3812 2
转载 【深入理解Batch Normalization(3)】pytorch——nn.BatchNorm2d()函数
https://blog.csdn.net/bigFatCat_Tom/article/details/91619977https://pytorch-cn.readthedocs.io/zh/latest/package_references/torch-nn/#normalization-layers-sourcehttps://blog.csdn.net/t20134297/article/details/104960101基本原理对小批量(mini-batch)3d数据组成的4d[batch
2021-03-04 14:31:16 3252 1
转载 PyTorch——nn.Conv2d和其中的padding策略,Caffe、Tensorflow的padding策略
caffe偷偷摸摸地把一行0补在上面 或者 把一列0补在左边,tensorflow正好镜像对称,把一行0补在下面或者把一列0补在右边。这就是导致输出对齐不了的原因,前面几层输出的feature map的中间还能勉强对上,随着网络结构的加深,到fc之前已经完全对不上了。也就是说: caffe的padding策略是把0补在左上。 tensorflow的padding策略是把0补在右下。
2021-03-04 14:06:10 1460 1
原创 torchvision中Transform的normalize参数含义, 自己计算mean和std,可视化后的情况,其他必要的数据增强方式
文章目录疑问1:疑问2 ,如何得到[0-1]的图像疑问3:PIL.Image/numpy.ndarray与Tensor的相互转换疑问4 :PIL.Image的缩放裁剪等操作其他必要的数据增强方式参考:一下是一个常用的Normalize的代码normalize = transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225])mean就是均
2021-03-04 09:52:28 11778 4
转载 详解PyTorch中的ModuleList和Sequential
在使用PyTorch的时候,经常遇到nn.Sequential和nn.ModuleList,今天将这两个模块认真区分了一下,总结如下。PyTorch版本为1.0.0。https://zhuanlan.zhihu.com/p/75206669nn.Sequential与nn.ModuleList简介nn.Sequentialnn.Sequential里面的模块按照顺序进行排列的,所以必须确保前一个模块的输出大小和下一个模块的输入大小是一致的。如下面的例子所示:#首先导入torch相关包import
2021-03-04 08:50:33 1065 1
转载 1月13 PyTorch 中模型的使用,保存加载模型
神经网络训练后我们需要将模型进行保存,要用的时候将保存的模型进行加载,PyTorch 中保存和加载模型主要分为两类:保存加载整个模型只保存加载模型参数https://zhuanlan.zhihu.com/p/73893187一、保存加载模型基本用法1、保存加载整个模型保存整个网络模型(网络结构+权重参数)。torch.save(model, 'net.pkl')直接加载整个网络模型(可能比较耗时)。model = torch.load('net.pkl')2、只保存加载模型参数
2021-03-03 11:11:50 231
转载 3月3 pytorch模型保存的.pt, .pth, .pkl的pytorch模型文件,只是后缀不同而已(仅此而已),打开方式
pytorch模型保存的格式。首先讲讲保存模型或权重参数的后缀格式,权重参数和模型参数的后缀格式一样,pytorch中最常见的模型保存使用 .pt 或者是 .pth 作为模型文件扩展名。还有其他的保存数据的格式为.t7或者.pkl格式。t7文件是沿用torch7中读取模型权重的方式,而pth文件是python中存储文件的常用格式,而在keras中则是使用.h5文件 。我们经常会看到后缀名为.pt, .pth, .pkl的pytorch模型文件,这几种模型文件在格式上有什么区别吗?其实它们并不是在格式上有
2021-03-03 11:07:05 7942
转载 pytorch与resnet(六) 预训练模型使用的场景
声明:该部分为转载参考简单来说,预训练模型(pre-trained model)是前人为了解决类似问题所创造出来的模型。你在解决问题的时候,不用从零开始训练一个新模型,可以从在类似问题中训练过的模型入手。场景一:数据集小,数据相似度高(与pre-trained model的训练数据相比而言)在这种情况下,因为数据与预训练模型的训练数据相似度很高,因此我们不需要重新训练模型。我们只需要将输出层改制成符合问题情境下的结构就好。我们使用预处理模型作为模式提取器。比如说我们使用在ImageNet上训练的模
2021-03-03 11:05:22 2769
翻译把STL容器放入共享内存
2024-06-20
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人