自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 K230图传方案改进

本文介绍了基于K230开发板的H265编码图传方案,相比之前JPEG方案的15帧,新方案帧率提升至55帧。作者分享了H265编码传输的实现细节,包括WIFI连接建立、Socket通信配置以及H265编解码处理流程,并指出当前方案存在摄像头通道冲突和YUV图像格式限制。文章提供了完整的代码实现,虽然存在一些应用场景限制,但为K230开发者提供了高效的图传解决方案。作者表示该方案已在比赛中实际应用,并希望通过分享帮助其他开发者更好地利用K230的硬件编解码能力。

2025-08-05 19:05:59 103 1

原创 K230图传部署

为什么说它难度大,因为如果你想进行图传并且图传的还是一个有检测框的图像,集成了很多东西,官方的这个例程没办法照搬,甚至于我去看了PipeLine, ScopedTiming,YOLO11这里面的源码,才提取出我想要的东西,在没有看源码之前,我遇到了很多神奇的报错:有摄像头重复初始化,有通道重叠,还有莫名的运行一会直接卡死然后还不报错等等,也是在拜读了很长一段时间的源码后才成功的将这个功能实现。,我觉得我还是具体的讲一讲流程可以让你们更加清晰,这个流程大概就是这样,但其中复杂的事多了,我一一说明。

2025-05-16 19:21:26 1074 1

原创 项目实战:卷积神经网络识别人脸表情

验证部分与训练相差不多,其中_,predicted = torch.max(output.data,1)这个函数意义时,output是最终是一个一维的数据前面的模型搭建我们可以知道,.data是因为数据已经迁移到GPU中我们需要使用.data取出GPU中的数据,target.size(0) 返回当前批次的样本数量,将其累加到 total 中,(predicted == target) 会对预测结果和真实标签进行逐元素比较,返回一个布尔类型的张量,其中 True 表示预测正确,False 表示预测错误。

2025-02-04 15:21:04 856

原创 卷积神经网络一些准备工作

其中dataset为我们的数据集,batch_size是批次的大小,因为在进行神经网络训练时如果数据集过多模型过于复杂我们需要选择合适的批次来进行训练保证速度与准确率,shuffle是我们是否要对数据进行打乱处理可以有效防止模型过拟合(也就是泛化能力弱),num_workers大概率用不上它是选择进程的,drop_last是指是否舍弃最后不足批次大小的数据,pin_memort表示是否将数据加载到固定内存中。这三个类可以说搭建一个神经网络的关键,在后面我将一步一步完成一个简易的卷积神经网络全过程。

2025-01-31 11:45:08 195

原创 学习复习:卷积神经网络

跟它的名字一样最大池化就是找出你所设置的池化核范围最大的那个值当作池化后的值,经过这样的操作图像也会相应的变小,最终体现的效果就跟将图像打了马赛克一样,但是特征还在,我们在后面设置时它也有stride和padding但一般都是默认的,根据默认的结果图像会被才建成之前的1/2.下面是一张对图像进行简易的卷积神经网络的操作流程,看完我上面的介绍,如果大家能够理解这样的网络构型,那代表至少卷积神经网络已经快要入门了,其中我对里面我没有讲到的做一下解释方便大家去自行查阅资料,ReLU是一个常见的。

2025-01-26 15:39:07 354

利用H265编码作为图传方案,从K230到PC端

利用H265编码作为图传方案,从K230到PC端

2025-08-05

利用K230向客户端通过socket通信进行图像传输

利用K230向客户端通过socket通信进行图像传输

2025-05-23

基于fer2013数据集的卷积神经网络识别人脸表情

基于fer2013数据集的卷积神经网络识别人脸表情

2025-02-19

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除