- 博客(218)
- 资源 (1)
- 收藏
- 关注
原创 python脚本编译为.so速度对比
计算能力加速,本质上编译过程为python -> c -> so文件,相当于动态语言转换为静态语言,程序执行能力和计算能力有所提升。编译为so文件后比原始python代码执行时间快2ms左右。产品代码保护,so文件不可读。
2024-09-18 14:15:34 264
原创 视频监控基础学习
Onvif协议的出现,解决了不同厂商之间开发的各类失败不能融合使用的难题,提供了统一的网络视频开发标准,即最终能够通过Onvif这个标准化的平台实现不同产品之间的集成。:网络硬盘录像机产品,搭配IPC使用。集成存储、解码显示、拼接控制、智能分析等多种功能于一体。一机多用,部署简单,功能齐全。ONVIF(Open Network Video Interface Forum,开放型网络视频接口论坛)以公开、开放的原则共同制定开放性行业标准。:网络摄像机的标准协议。网络摄像机的标准协议。
2024-09-14 16:52:36 293
原创 cv2.bitwise_or 提取ROI区域
在执行一次bitwish_or,可获取如下结果,通过这种方式可以获取不规则的ROI。如果圆形ROI区域需要再次去除周围的黑边,可以用同样的方法,构造一个矩形mask。以上图像和原图做bitwish_or可获得如下图像,提取圆形ROI区域。原图如下所示,想提取圆形ROI区域,红色框。使用一个和原图尺寸一致的图像做mask,
2024-09-13 14:31:57 377
原创 SAM 2: The next generation of Meta Segment Anything Model for videos and images
https://ai.meta.com/blog/segment-anything-2/ https://github.com/facebookresearch/segment-anything-2 https://zhuanlan.zhihu.com/p/712068482
2024-09-02 15:08:17 224
原创 Stirling-PDF:基于Web的开源PDF处理工具
PDF文件进行各种各样的操作,比如合并、拆分、加密、解密、旋转、压缩等等,功能超全,而且开源免费,简直是神器!
2024-09-02 11:32:54 432
原创 AnomalySD:具有Stable Diffusion的少样本多类异常检测
的少样本多类异常检测框架,设计了不同的分层文本描述和前景掩码机制来微调 SD,实现了最先进的异常分类和分割性能!AnomalySD:一种采用。
2024-09-02 10:28:16 336
原创 北航开源Crowd-SAM,基于SAM用于目标检测和分割,简化标注流程!(附论文及源码)
北航开源Crowd-SAM,基于SAM用于目标检测和分割,简化标注流程!(附论文及源码)
2024-07-23 09:19:59 502
原创 免费论文专利检索网站
免费专利检索平台:https://pss-system.cponline.cnipa.gov.cn/conventionalSearch。知识产权管理系统:https://hollysys.inno.zhihuiya.com/innoe-web/dashboard。免费论文检索平台:https://pubscholar.cn/
2024-07-01 15:48:05 839
原创 PP-ShiTuV2 图像特征匹配
PP-ShiTuV2是一个实用的轻量级通用图像识别系统,主要由主体检测、特征学习和向量检索三个模块组成。这里只利用特征学习和向量检索模块,特征提取时使用的都是主体突出的图像。
2024-06-19 15:06:46 377
原创 marker-快速精准实现PDF转Markdown
文本提取:首先,Marker使用OCR技术(如果需要)来提取PDF中的文本。块组合与后处理:最后,Marker将所有文本块组合起来,并使用后处理工具(如pdf_postprocessor)进行最终的文本整理,以提高输出质量。文本块清理与格式化:对于每个文本块,Marker使用启发式方法和Texify等工具进行清理和格式化,以确保文本的准确性和可读性。模型的智能使用:Marker只在必要时使用深度学习模型,这有助于提高转换速度和准确性。
2024-06-17 17:48:42 1347 1
原创 修改onnx模型中间节点命名(包含输入、输出重命名)
前者表示原模型中各个命名(可指定多个),后者表示新命名,两个参数指定的命名个数需要相同。依赖:import onnx。
2024-06-11 15:39:30 591
原创 FUXA 文档
FUXA是一款功能强大的基于web的软件,可快速构建和部署可扩展的SCADA, HMI, Dashboard或IIoT系统。使用FUXA,您可以为您的机器和实时数据显示以及自动化工业工厂的控制仪器创建具有个性化设计的现代过程可视化。
2024-04-18 17:33:09 916
原创 边缘检测-Tiny and Efficient Model for the Edge Detection Generalization
为了实现这一点,我们提出了微小和高效的边缘检测器(TEED)是一种轻量级的卷积神经网络,只有58K个参数,不到最先进模型的0.2%。我们提出的模型易于训练,并且在最初的几个epoch内快速收敛,同时预测的边缘图清晰且质量高。此外,我们提出了一个新的数据集来测试边缘检测的泛化,它包括用于边缘检测和图像分割的常用图像的样本。在这项工作中,我们考虑三个主要目标来解决边缘检测:简单,效率和泛化,因为当前最先进的(SOTA)边缘检测模型的复杂性增加了,以获得更好的准确性。
2024-03-19 11:03:53 738 1
原创 pytorch环境检查GPU是否可用
查看当前cuda是否可用于当前版本的Torch,如果输出True,则表示可用。# 编译当前版本的torch使用的cuda版本号。# 查看torch当前版本号。
2024-03-13 11:37:40 839
原创 SRS服务器ffmpeg 推流rtmp超时中断
The timeout in seconds to disconnect publisher when idle, which means no players. 已秒为单位的超时断开。# Note that 0 means no timeout or this feature is disabled. 0表示没有超时或者禁用此特性。SRS配置文件修改下面这项。
2024-03-05 09:56:13 1473
原创 ffmpeg 推流报错 Error writing trailer of rtmp:// End of file
推流一段时间以后就会报这个错误,有没有人知道怎么解决呢?
2024-02-27 15:06:25 858
原创 ffmpeg命令生成器
FFmpeg CommanderFFmpeg Command Generatorffmpeg string creator
2024-02-05 17:15:48 1540
原创 SRS视频服务器使用记录
SRS是一个开源的()简单高效的实时视频服务器,支持RTMP、WebRTC、HLS、HTTP-FLV、SRT、MPEG-DASH和GB28181等协议。SRS媒体服务器和等客户端配合使用,提供的能力,是一个典型的发布 (推流)和订阅(播放)服务器模型。SRS支持互联网广泛应用的音视频协议转换,比如可以将或, 转成或或等协议。注意:SRS6属于开发版,不稳定。
2024-02-05 14:28:16 1092
原创 AIGC项目——Meta:根据对话音频生成带动作和手势的3d逼真数字人
我们的方法背后的关键是将矢量量化的样本多样性的好处与通过扩散获得的高频细节相结合,以产生更动态,更具表现力的运动。我们使用高度逼真的虚拟人物来可视化生成的运动,这些虚拟人物可以在手势中表达关键的细微差别(例如嘲笑和傻笑)。实验表明,我们的模型生成适当和多样化的手势,优于扩散和VQ-only方法。6-生成的面部和身体运动都被传递到我们训练过的头像渲染器中,以生成逼真的头像。1-我们捕获了一个新颖的、丰富的二元对话数据集,可以进行逼真的重建。从二元对话的音频中,我们生成相应的逼真的面部、身体和手势。
2024-01-30 17:19:21 1161 2
原创 在本地电脑上打开服务器里面的localhost网址
1. ssh新建一个远程连接,将服务器的7860端口重定向到本机。在本地浏览器将127.0.0.1改成服务器ip但是无法访问。如果没有包安装pip install visdom。2.在服务器上启动visdom.server。远程连接服务器,启动了一个服务。本地电脑可以访问服务器的网址。
2024-01-30 16:11:53 3162 2
原创 Git项目 Building/installing from source
【代码】Git项目 Building/installing from source。
2024-01-30 10:30:42 422
原创 mmocr 安装及快速运行
errorerror: subprocess-exited-with-errorpython setup.py bdist_wheel did not run successfully.note: This error originates from a subprocess,and is li_this is an issue with the package mentioned above, not pip.此版本如果不指定mmdet版本会报错,
2024-01-26 15:46:09 1376
原创 Segment Anything:SAM系列模型(SAM、EfficientSAM、MobileSAM、MobileSAM-v2、FastSAM)
这种设计受到《基于Trasformers的端到端目标检测》和Maskformer的启发,使用了一个修改的Transformer解码器block,后跟一个动态掩码预测头。修改后的解码器block在两个方向(提示到图像嵌入和图像嵌入到提示)上使用自注意力和交叉注意力来更新所有嵌入。在运行两个Block后,对图像嵌入进行上采样,并通过MLP层将输出标记映射到一个动态线性分类器(该分类器用于计算每个图像位置的掩码前景概率)。密集提示(即掩码)使用卷积进行嵌入,并与图像嵌入进行逐元素求和。
2024-01-19 11:34:43 3691
原创 EfficientSAM 代码推理
经过推理测试3090GPU,官方测试图片1072*603 使用框或者点prompts 使用vitt模型需要41-58ms左右,显存7G左右。官方给的推理代码是CPU版本的,如果想使用GPU推理需要自己修改一下。使用全图分割耗时会更长。
2024-01-12 18:22:48 923 11
原创 Nougat:科学文档的OCR 使用记录
模型默认下载地址:/home/****/.cache/torch/hub/nougat-0.1.0-small。如果需要使用GPU,则需要重新安装和自己cuda版本对应的torch等,我这边是cuda11.8。显存占用17368 / 24576M 显存占用17G,16页的PDF 耗时30秒。vscode中使用如下插件可以查看mmd格式中的内容,文字可直接复制。在output目录下会生成.mmd格式的文件。python环境需要在3.8以上。环境配置好之后即可进行PDF识别。环境安装好之后默认使用cpu。
2024-01-04 10:36:09 1175
原创 conda 虚拟环境使用
查看已有的虚拟环境conda env list创建虚拟环境且带pythonconda create -n test123python=3.7激活虚拟环境(To activate this environment)conda activate test123退出虚拟环境(To deactivate an active environment)conda deactivate
2023-12-20 16:07:58 624
原创 opencv常用算法
cv2.normalize()cv2.applyColorMap(T, cv2.COLORMAP_JET)cv2.bitwise_or() 可以用于提取ROI区域
2023-12-06 18:20:06 131
luna16数据集百度云资源
2019-10-01
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人