AI自由行
文章平均质量分 83
视觉,模式识别和机器学习,测重工业应用
子正
一任情感和直觉,近乎禽兽
展开
-
瑞芯微系列 video stream out的一些基础知识
是的,你的理解是正确的。在 GStreamer 中,**PPS(Picture Parameter Set)**的处理主要是在编码阶段由 x264enc 来完成,而 h264parse 和 rtph264pay 主要用于解析和打包已经编码好的 H.264 数据流,无法直接修改 PPS 或 SPS 的内容。实际分辨率与标明的分辨率:编码器可能会将视频帧编码为实际分辨率(如 1920x1088),但在流的格式字段中(如 SPS/PPS 中),它可能标明了标准的分辨率(如 1920x1080)。原创 2024-08-26 15:34:20 · 556 阅读 · 0 评论 -
ONVIF 摄像头视频流获取 - 步骤与Python例程
.基本流程加入组播udp接口,查询子网内在线的ONVIF摄像头的设备地址:设备地址形如:http://192.168.0.6/onvif/device_service这一步,参看上一篇发文:[ONVIF系列 - 01] 简介 - 设备发现 - 相关工具-CSDN博客查询mediaService Uri地址mediaService地址形如:http://192.168.0.6/onvif/Media查询用户的Profiles,得到一个我们需要的Profile原创 2024-08-02 09:38:15 · 1501 阅读 · 0 评论 -
瑞芯微平台H.264硬件编码推流的注意事项
注意,与拉流推流花屏,绿屏相关的问题,本质只有一个——就是缓冲区的点阵数量不对。出现问题时,纠错的第一步始终是打印frame缓冲区,看看那个尺寸与你的预估是否相同。width*height*1.5的,一定是YUV型数据width*height*3的,一定是RGB数据。比理论数据多一个尾巴的,一定是因为h264或者h265编解码对齐,产生的一些数据:比如:1920*1080在编解码之前需要对齐到1920*1088。。。。对于编码器而言,这个限制条件仍然存在,在进入硬件编码器之前,你需要手工原创 2024-07-30 16:31:00 · 426 阅读 · 0 评论 -
瑞芯微平台H.265 真实视频分辨率获取例程 - in python
如果你在使用瑞芯微平台遭遇解析.h265视频帧时,YUV图片绿屏,或者显示混乱,这就是解决方案。相关分析过程可参考临近的几篇分析文档。原创 2024-07-29 14:29:37 · 517 阅读 · 0 评论 -
[笔记] 卷积03 - 运算的对称性 时域构建高通滤波器的失败尝试
卷积运算的运算交换律结合律分配率,典型的低通滤波曲线与实验,尝试在时域徒手构建高通滤波器对应的响应函数,失败,以及失败的原因——高通滤波器在时域的等价物:时间响应函数无法用初等函数的有限排列组合实现。。。。它必须是个差分方程。原创 2024-07-04 10:31:59 · 1419 阅读 · 2 评论 -
YOLOv10在RK3588上的测试(进行中...)
yolov10的测试,之前yolov5我的实测数据,在rk3588上只能达到每秒10帧。原创 2024-06-13 17:09:25 · 1241 阅读 · 9 评论 -
[笔记] rknn Toolkit1.6=>2.0 API变动注释
RKNN 1.6=>2.0的一些API和编译参数变动概要。然后还有RKNN建模和模型转换的笔记。原创 2024-06-07 11:32:56 · 1100 阅读 · 0 评论 -
Yolo-v5模型训练速度,与GeForce的AI算力描述
GeForce RTXTM 3070 Ti 和 RTX 3070 显卡采用第 2 代 NVIDIA RTX 架构 - NVIDIA Ampere 架构。该系列产品搭载专用的第 2 代 RT Core ,第 3 代 Tensor Core、全新的 SM 多单元流处理器以及高速显存,助您在高性能要求的游戏中所向披靡。3090量化到FP32,使用官方的Pytorch跑,完整的60 classes coco数据集一个是18.04小时。Coco训练集大概是12万张图片,60 classes.原创 2024-06-04 09:36:07 · 712 阅读 · 0 评论 -
rk3588 - yolov5 60帧/s的尝试[处理中...]
yolov5 rknn群里的信息,拉+推的视频延迟总体原创 2024-05-13 10:58:12 · 779 阅读 · 1 评论 -
YUV2RGB
视频YUV格式转为RGB点阵的python实现。原创 2024-05-07 15:16:51 · 128 阅读 · 0 评论 -
如何判断嵌入式平台OpenCV在使用硬件编解码器?
查看系统自带的.264硬编码器是否已经生效的判断标准。原创 2024-04-30 16:50:18 · 1161 阅读 · 3 评论 -
视频转换过程中的几个基本注意事项
视频转换过程中的一些低级错误的由来,以及针对性的处理策略,程序框架和示例代码。原创 2024-04-29 20:48:52 · 340 阅读 · 0 评论 -
图像识别模型onnx2rknn转换程序(可用于鲁班猫4 - rk3588s)
yolov5 在rk3588平台的.rknn模型库原创 2024-04-29 11:33:38 · 400 阅读 · 0 评论 -
利用mediamtx搭建rtsp流媒体server
介绍了rtsp流媒体服务器的一种实现方式;通过mediamtx,它可以很容易地很python环境集成。这个流媒体服务器提供rtsp, rtmp等多种媒体流发布。原创 2024-04-29 11:14:11 · 1879 阅读 · 4 评论 -
购买国外技术书籍的途径
技术书籍的网购指南,推荐了美国的thriftBooks.com网站原创 2024-04-15 08:58:20 · 593 阅读 · 0 评论 -
AI算法中的关键先生 - 反向转播与戴维莱姆哈特
AI机器学习过程中的关键先生:反向传播算法的设计人。原创 2024-03-28 11:10:22 · 386 阅读 · 0 评论 -
工作中的障念 - AI运算超时
hi,为什么我在工作的时候会遭遇一种无法描述的障念,问题并不复杂,但是似乎有一堵无形的墙挡着自己不能前进。这是一种普遍现象吗?原创 2024-03-25 17:16:50 · 599 阅读 · 0 评论 -
机器学习的核心算法 - CNN的原理探讨
个人理解:神经网络的计算是一个使用特定的虚拟传感器对数据进行采样(卷积层),然后对卷积层的结果——升维的张量进行归一化和抑制、增强处理(激活函数层),然后将这些数据进行再次采样(池化层)降低解算复杂度。然后对所有传感器的张量数据总体依照标定的输出结果,反向推导参数,甚至逐级回溯,根据大量的数据输入,对特定问题的一组参数矩阵的额求解过程,类似参数拟合。最终将参数稳定下来,求得一个参数矩阵。原创 2024-03-25 14:03:12 · 1841 阅读 · 0 评论 -
为什么电脑降价了?
周末,非常意外地用不到3000元买到了一款2023年度发布的华为笔记本I5,16G,500G,基本是主流配置,我非常意外,看了又看,不是什么Hwawii,或者Huuawe。然后也不是二手。为什么呢?因为在ALU和FPU之外,一个新的部件即将成为标配:NPU。原创 2024-01-22 18:42:52 · 2241 阅读 · 2 评论 -
数据库连接问题 - ChatGPT对自身的定位
Chapt GPT会根据问题,提供必要的辅助性信息。当你的问题显得非常不专业的时候,它只能反馈给你一些更简单,更容易理解的信息。当你的问题涉及到某个概念时,它才会把相关概念所涉及的另一套信息反馈给你。我的理解应该还不够准确。本文也大致描述清楚了数据库访问时,如何优雅地处理数据库连接。更稳健,更便捷地使用数据库连接。原创 2023-12-21 20:38:38 · 1126 阅读 · 0 评论 -
AI换脸的一种技术实施例
人脸识别过程:1.首先识别到关键的人脸部分,经过一个粗筛过程,把目标物的脸部图样先抓出来。2.然后,因为人脸的水平,垂直角度是可变的,所以第二部,它会把人脸强制归正,归一化到平视,摄像头正向前置,人脸的尺寸也缩放到与人脸库中的人脸尺寸相当的地步。3.开始最简单的特征点位比对。并且注意,第2步运算是可逆的矩阵运算,就是把正面照贴合到任何一个角度和姿态。所以,这就是换脸的技术路径。通过上述方法可以把人脸数据库里任何人的脸与原始图片做无缝贴合——换掉你的脸。原创 2023-11-16 15:36:15 · 273 阅读 · 0 评论 -
AI图像识别初次尝试
3.1 yoloV3的训练库使用的分辨率是一个正方形的分辨率,416*416或者压缩,或者是扫描。3.2上面筛选目标对象的代码没有代入,所以误识别到了一些其他物体。3.3 yoloV3的训练库名称是:yolov3.weight yolov3.cfg3.4置信概率50%。原创 2023-11-01 16:54:28 · 497 阅读 · 2 评论