- 博客(91)
- 收藏
- 关注
原创 faster_rcnn锚框生成与原理
这个k是怎么来的呢,每个像素点对应原图的一个框,这个框需要进行预测,他应该长什么样子,所以设定k个框来对应这个锚点,并通过分类来判断这个框是前景还是背景,然后通过回归对锚框进行优化。定义生成框(总的),这段代码首先利用base_size生成base_anchor,是一个[0,0,15,15],之后生成一个以基础框长宽比生成的锚框,之后通过结合以尺度生成的锚框来得出最终的锚框。通过一个3*3的卷积核对输入特征进行卷积,不改变输入特征的长宽,只改变通道数,卷积操作之后,输出的每一个特征点都会映射k个锚框。
2024-07-18 21:02:04
108
原创 resnet50网络搭建
它分成两个基本模块,一个是basic block,另一个是bottle neck模块,一般层数较低的用basicblock搭建,层数较深的用bottle neck模块,resnet50用的是bottleneck搭建的,两个模块的网络结构如图下。为什么有多余的一个边,通俗讲就是为了可以搭建更深的网络,采用F(X)+X求它的梯度比F(X)的梯度更不容易导致梯度下降。另一种说法是当这一层的卷积权重不那么重要的时候就可以直接连接下一部分,也就是那条多的线,而忽略掉卷积权重这一部分。结果与图2的网络结构是一致的。
2024-07-15 15:54:24
240
原创 faster-rcnn代码解析
cfgs/args.net_ls.yml”,如果不是则设置cfgs/args.net_yml,这个large_scale是在前面的命令行参数设置的。这个代码是在配置文件中的,判断是否为大尺度图像,如果是,则执行前面的文件设置为,以字典的方式访问对象的属性。
2024-07-15 15:08:04
202
原创 three.js添加多个画布
多个场景的渲染需要多个画布,但是这样会导致加载模型纹理次数变多,基本方法是用一张canvas在整个背景中填充视口,利用其它元素作为每个虚拟画布,只在canvas中加载一个渲染器renderer,并为每个虚拟画布创建一个场景,这样只需要确保每个虚拟画布的位置,three.ja就会将他们渲染在整个屏幕中指定的位置。这样我们只添加了一个canvas,仅使用了一个webgl contexts,解决了webgl上下文数量限制问题。
2024-07-14 21:20:06
191
原创 monodepth代码与原理对照实现
这行代码是为tensorflow设置环境变量TF_CPP_MIN_LOG_LEVEL,用来控制tensorflow c++后端输出的日志级别。包括(调试信息)DEBUG,信息(INFO),警告(WARNING),错误(ERROR)和致命错误(FATAL)。这是用于调试作为目的,提供大量的输出信息。添加命令行参数,其中包括编码器resnet50,图像路径image_path,权重文件checkpoint_path,输入图像的长宽大小。下一步就是视差的函数创建,这一部分还不太了解,最好是论文的学习。
2024-07-13 20:21:57
187
原创 gd32发送数据,定义参数,接收中断
刚才自以为看懂了,等自己写的时候发现也不知道怎么弄。所以亲身敲一下代码对内容的理解还是很有帮助的。之后修改波特率,直接修改数比较麻烦,可以通过设定一个参数,也就是修改固件库中的内容,这是在c文件中定义函数,之后在h文件中声明,
2024-07-12 10:32:14
204
原创 gltf模型加载 与3d背景贴图
点击右边的jpg,右键将图像另存为,放到public里面。用于3d模型跟贴图下载资源。模型放到public里面。
2024-07-11 16:59:20
515
原创 esp32硬件电路设计
ESP-IDF 入门指南 | 乐鑫科技 (espressif.com)ESP32-DevKitC V4 入门指南 - ESP32 - — ESP-IDF 编程指南 v5.1 文档 (espressif.com)
2024-07-10 20:52:40
201
原创 pytorch官网examples 实现
之后read_image也报错读取不了,所以我直接用PIL中的Image来读取图像。最后用plt显示图像。这段代码随机放大图像中的某一部分,每次运行显示的图像是不一样的。不太理解所以我自己写了一段修改之后的代码,效果是一样的。这里v2报错没有,他这里直接这样就可以生成随机大小图片。
2024-07-09 17:32:19
156
原创 android studio基础教程实现背景,文字修改,边框
他这里用的是kotline代码,不是java,我们可以新建一个kotlin项目。首先看一个演示代码:好吧这是个外网看不了,那就跳过。网上菜鸟教程有很多,就一个一个来吧。怎么这么多文档,真的好呀。
2024-07-07 20:06:38
218
原创 模型加载gltf
执行new GLTFloader()就可以实例化一个gltf加载器对象。2.GLTF加载器new GLTFloader()1.引入GLFloader.js模型加载器。通过这个方法就可以加载外部gltf模型。3.gltf加载器方法.load()
2024-07-06 14:07:38
211
原创 可视化学习之pytorch可视化工具visdom
模型训练过程中需要实时监听并可视化一些数据,如损失值loss,正确率acc等。在tensorflow中,使用的工具为tensorboard;点开pycharm,新建一个文件,导入visdom。在浏览器输入这个网址。
2024-07-01 21:44:17
280
原创 GD32学习
怎么使用呢,就比如上面这个图片,根据它的注释来一步步的写入你想要的参数,gpio_bit_set(),第一个参数放什么呢,从上图注释,第一个是gpio_periph,也就是gpio口,arg就是要填的东西,我这里填(GPIOA),gpio_bit_set(GPIOA,),第二个参数就是pin几,arg后面填写标准是GPIO_PIN_x,我这里填GPIO_PIN_1,最终写出来的就是gpio_bit_set(GPIOA,GPIO_PIN1),这个函数是置位的意思,将指定位置一。
2024-06-21 20:18:48
283
原创 卷积网络热图显示
【卷积神经网络可视化】之热度图可视化_visualizing heatmaps of class activation in an ima-CSDN博客
2024-06-16 21:27:35
177
原创 stm32实战
这个代码名称为HAL_Receive_IT,中断接收函数,这个函数用来表示操作的状态(名称为HAL_StatusTypeDef状态类型)·huart:用来指向uart句柄的指针,该句柄配置了uart模块配置信息。·pData:指向数据缓冲区的指针,用来存储接受的数据。·size:接受数据的大小,以字节为单位。
2024-06-13 10:05:49
397
原创 vue+three.js实现按钮在模型前部,及各个功能
注意position是绝对(absolute)的,这样才能实现,zindex这里要把显示的按钮或窗口大于模型的zindex,就可以啦,最后附上代码。可以看到按钮显示在模型上一层,终于成功了,太棒啦。实现方法真的很简单,就是通过官方教程实现的。想看效果的赶紧实现一下吧!methods中也就是js。
2024-06-06 22:33:28
241
原创 智能化摆脱人力所面临的问题
随着智能化的发展,摆脱人力的地方越来越多,但是摆脱的人力何去何从并没有考虑到,等到失业率达到一定节点,矛盾可能会优先在一些资本主义国家中爆发。
2024-04-25 15:39:42
102
原创 关于魔改网络的学习心得
最近开完会师兄与我们师弟们聊了一下改模型的一些技巧,感觉虽然听起来简单,但是对于我这种啥都不懂的小菜鸡来说学到了很多,目前改的地方就是在模型当中,通过打印模型输出来查看模型有多少层,有多少个卷积,池化等,输出知道了那么之后就可以在模型里面加东西了,怎么加呢,就是无论怎么加只要让输出与原来输出一样,然后开始跑,如果准确率提高了,那么就可以写论文了,但是这也是没有办法的办法,但是对于摸不着头脑的同学来说应该有所帮助。
2024-04-08 15:12:13
298
2
原创 demo\faster_rcnn_r50_fpn_1x_coco-person.py“ does not exist
mmdetection/configs/faster_rcnn at master · open-mmlab/mmdetection · GitHub
2024-03-20 08:26:56
255
原创 element组件使用教程
然后使用就可以使用官方的组件了,首先新建一个vue文件,在element中找一个组件代码,用一下。在main.js文件中导入组件以及需要使用。下载完成后如何使用呢。
2024-03-08 08:43:16
461
原创 相关领域最新权威论文网站papers with code
下面是可以看到这个领域最新的相关论文,这里可以下载论文以及代码code。点开某一领域例如人物交互会出现公共数据集。
2024-03-05 14:58:34
384
原创 cnn可视化工具
https://mbd.baidu.com/ma/landingpage?t=smartapp_share&scenario=share&appid=oFx3nbdDN6GWF3Vb0Wh7EDBMBxRTTcfe&url=%2Fpages%2Farticle%2Findex%3Fid%3D658596017%26isShared%3D1&title=PyTorch%E5%8F%AF%E8%A7%86%E5%8C%96%E5%B7%A5%E5%85%B7%E4%BB%8B%E7%BB%8D&content=
2024-03-05 14:34:12
405
原创 人物交互检测的实例中心注意网络
由于视觉关系检测或场景图生成的目标之一是理解图像中的物体及其之间的关系,而这些关系往往可以通过自然语言进行描述,因此可以利用自然语言处理中的语言先验知识来帮助模型理解图像中的关系。在这个图结构中,图像中的目标对应图中的节点(graph node),而目标之间的关系则对应图中的边(graph edge)。如图2所示,编码上下文的示例包括选择一个辅助框[13],使用人和对象边界框[29]的并集,提取人姿态关键点[6]周围的特征,或者从整个图像[31]中利用全局上下文。的属性,并将其初始化为一个空字典。
2024-02-16 15:46:52
1163
原创 pyskl模型代码
这里以D:\pyskl-main\configs\posec3d\slowonly_r50_ntu120_xsub\joint为例。是 Python 中用于初始化一个包的特殊文件。当你尝试导入一个包或模块时,Python 会首先查找该包或模块是否有一个。通过config配置文件调用选择的模型来进行搭建,最后通过train文件调用模型训练,现在对模型代码进行分析。这段代码是一个Python的import语句,它从上层目录(由两个点表示)的。从resnet3d导入ResNet3d模型。
2024-02-03 14:19:02
612
原创 pyskl代码解析(3)
这里调用了一个函数frame_extraction帧提取参数有两个分别是命令行中输入的视频,以及默认的图像的大小设置。可以试一下将大小修改后的视频情况。1)首先main函数先args = parse_args()解析命令行参数,通过调用这个函数,你可以获取到用户在命令行中传递给程序的参数值。可以看到提取帧变少,视频变得模糊,但是为什么左上角的字也变大了呢。命令行没有输入这些,那麽就会按照默认的进行执行。(1)这一部分是用来对标签颜色大小线的粗细进行的设置。2)第二行代码就是对输入的视频进行的处理。
2024-01-31 15:42:31
625
原创 pyskl训练报错分布式训练问题
这不是分布式训练的问题,在官方文档中也提到过,如果有一个gpu在numgpus写1就可以。主要的问题是下载一个visual stdio c++工具,就可以跑了。
2024-01-30 22:31:41
467
1
原创 PYSKL问题解决AssertionError: Failed to build the detection model.
首先这个问题是安装mmcv-full出现的问题,如果是从这个网站下的(如下图),那么不要用了,这里面的whl驱动文件出现了问题。1.之前有的网友碰见过这个问题,自己没有经历过所以回答的比较敷衍,自己再次安装碰到了这个问题,下面说下解决方法。2.正确的下载方式是从官网下载,这是最安全也最正规的一种方式。之后下拉找到这个地方,查看自己的版本,复制这段代码放到自己的环境终端里。安装完成后就能运行了。
2024-01-27 22:09:17
560
9
原创 MSG3D论文解读
每层结合来自像素及其相邻像素的数据,为该像素生成新的数据向量。前面的卷积层检测小规模的局部模式,而后面的卷积层检测更大、更抽象的模式。图卷积是一种基于图结构的卷积操作。与传统的卷积操作不同,图卷积的输入是一个图形,包含节点和边,而不是一个二维或三维的张量。图卷积的目的是通过学习节点之间的关系来进行特征提取和分类等任务。聚合:对于每个节点,将其邻近节点的特征进行聚合,可以使用均值、最大值、加权和等方式来计算邻近节点的特征。更新:根据聚合后的邻居节点特征以及当前节点自身的特征,更新当前节点的特征表示。
2024-01-22 22:22:17
621
原创 剖析setinterval用法
作为第一个参数,用来输出当前时间,间隔时间是1000毫秒即1秒钟。setInterval() 是 JavaScript 中的一个。4 停止 setInterval() 方法。
2024-01-16 21:04:35
486
原创 数据库制作与运行
python manage.py migrate会将新建的数据保存到数据库当中。之后输入代码python manage.py makemigrations。2.models.py文件里面定义表格和接口。
2024-01-12 14:55:06
353
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人