- 博客(136)
- 资源 (8)
- 收藏
- 关注
原创 百度飞将BMN时序动作定位框架 | 数据准备与训练指南 (下)
BMN模型是百度自研,2019年ActivityNet夺冠方案,为视频动作定位问题中proposal的生成提供高效的解决方案。
2022-07-06 09:30:02 988
原创 微信小程序 | 自动定时结束录制
主要是用setTimeout函数控制结束,还要考虑this指代的作用域wxml文件<!--index.wxml--><view class='camera'> <image src="/images/border.png" mode="widthFix"></image> <camera wx:if="{{isAuth}}" device-position="front" flash="off" binderror="error"&.
2022-05-01 11:15:00 583
原创 Ubuntu18.04 Docker Docker-Compose MySQL Milvus安装指南
ubuntu18.04安装Docker和Docker-compose
2022-04-29 09:03:29 776
原创 PaddleDetection开发套件 | VOC格式YOLO3训练
一、环境搭建PaddlePaddle 2.2 OS 64位操作系统 Python 3(3.5.1+/3.6/3.7/3.8/3.9),64位版本 pip/pip3(9.0.1+),64位版本 CUDA >= 10.1 cuDNN >= 7.6# CUDA10.1python -m pip install paddlepaddle-gpu==2.2.0.post101 -f https://www.paddlepaddle.org.cn/whl/linux/mkl/avx
2022-04-20 13:55:31 1894
原创 Paddle-Human 行为识别 | 使用NTU-RGB-D自定义数据集训练STGCN动作识别模型 (二)
上文说到Paddle-Human开源了行为识别模型,但是只能识别摔倒行为,那么现在我们将让模型能够识别更多行为。一、训练环境搭建项目地址:https://github.com/PaddlePaddle/PaddleVideohttps://github.com/PaddlePaddle/PaddleVideo训练STGCN是在PaddleVideo开发套件中完成的环境可以直接沿用上一篇博客里面的环境,毕竟torch装一遍太慢了Paddle-Human 实时行人分析 | 安装测试指南_訢詡的博
2022-04-19 09:13:09 6443 18
原创 Paddle-Human 实时行人分析 | 安装测试指南 (一)
PP-Human是基于飞桨深度学习框架的业界首个开源的实时行人分析工具,具有功能丰富,应用广泛和部署高效三大优势。PP-Human 支持图片/单镜头视频/多镜头视频多种输入方式,功能覆盖多目标跟踪、属性识别和行为分析。能够广泛应用于智慧交通、智慧社区、工业巡检等领域。支持服务器端部署及TensorRT加速,T4服务器上可达到实时。
2022-04-18 14:45:48 2269
原创 YOLO5 训练自定义数据集及避坑指南
一、项目地址:https://github.com/ultralytics/yolov5https://github.com/ultralytics/yolov5数据集完全可以沿用VOCDevkit格式数据集二、VOCDevkit格式数据|--VOC2007|---Annotations|---ImageSets|----Layout|----Main...
2022-04-14 17:04:30 2935
原创 InsightFace-Paddle实现人脸比对 | 不用建立索引的那种 (一)
需要任意两张同一个人的照片能够准确分辨出是不是同一个人,尽量简化识别过程,不需要知道是谁,也最好不用建立索引文件。现在这个版本的insughtface很奇怪,不知道为什么自己建立索引的时候需要每个人2张照片以上才能识别成功,不然就会报一个莫名其妙的错误。首先上项目地址:https://github.com/littletomatodonkey/insight-face-paddlehttps://github.com/littletomatodon...
2021-11-23 14:36:11 4783 11
原创 Python定时运行FFMPEG录屏然后自动保存MP4 | 难点讲解
import timeimport subprocessfilename = str(int(time.time()))command = "ffmpeg -f x11grab -s $(xrandr -q --current | grep '*' | awk '{print$1}') -r 2 -i :0.0+0+0 -b:v 150k -vcodec libx264 "+filename+".mp4"def runs(command): res = subprocess.Popen(...
2021-11-10 13:48:49 2258 2
原创 TextRenderer OCR的REC数据生成工具使用指南 (2)
上次说到TextRenderer 出了新版https://github.com/oh-my-ocr/text_rendererhttps://github.com/oh-my-ocr/text_renderer新版项目地址如上这个项目完全可以用上次旧版的TextRenderer虚拟环境先编译项目python setup.py develop然后pip install -r docker/requirements.txt -i https://pypi.douban.com/sim
2021-10-25 11:11:03 1106
原创 TextRenderer OCR的REC数据生成工具使用指南 (1)
它真的叫TextRenderer继上次研究了一个月为什么自己从新训练的PaddleOCR-v2-REC模型不收敛以后,迎来了下一个问题,数据多样性问题怎么解决?在官方项目提了issue之后得到了如下答案:TextRenderer TextRecognitionDataGenerator那么本篇博客我们就来看一下TextRenderer的效果怎么样项目地址为:https://github.com/Sanster/text_rendererhttps://github.com/Sanst
2021-10-25 10:18:22 1106 2
原创 Linux开机自启脚本 | 统信UOS实测
1、写一个shell文件,如果需要激活虚拟环境请一并写在里面,例如auto.sh#! /bin/bashcd ....source activate .....python .......2、写一个desktop文件,例如autoStart.desktop[Desktop Entry]Type=ApplicationEncoding=UTF-8Exec=/usr/bin/auto.shName=AutoStart3、把sh文件复制到/usr/bin下面sudo cp
2021-10-22 11:52:21 4878 2
原创 PaddleOCR多机多卡分布式训练指南 | 基于Ubuntu18.04
一、项目背景生僻字的fine-tune不能简单的使用几百个数据训练一下,这样会让之前学习到的忘掉。怎么办呢,就只能加大数据量,在git上提了issue以后简单了解到了以下内容:- 数据量要大 最少几百万条数据- 对于生僻字的覆盖要均匀 每个字最少出现200次以上- 场景尽量多样 可以做合成数据于是我就用前面的博客写的生僻字数据集制作,简单做了40w数据。我有两台2080,又没有办法把两个2080放在一个主板上,那么故事就开始了。二、环境配置首先要满足单机多卡或者单机单卡没
2021-10-12 10:36:07 2866 4
原创 Windows平台批量移动百万文件
大数据量做啥都很麻烦,比如几部分不同的数据合并到同一个文件夹,每个文件夹大概都有百万个小文件,全选、剪切、粘贴会直接卡死。第一步是获取文件列表:新建一个txt:DIR *.* /B >list.txt后缀改名为txt,把它丢到要采集的文件夹里面去执行(双击执行)你会收获一个包含文件名字的文本文档第二步:move D:批量新建文件夹\upload\20171225173033565_2052.jpg D:批量新建文件夹\1623move
2021-10-09 14:49:26 2519 1
原创 把ICDAR2019-LSVT原始数据集转为REC任务识别数据
ICDAR2019-LSVT数据集有两个:①Baidu Research Open-Access Dataset - Introductionhttps://ai.baidu.com/broad/introduction?dataset=lsvt是包含定位和标记的数据类型②飞桨AI Studio - 人工智能学习与实训社区集开放数据、开源算法、免费算力三位一体,为开发者提供高效学习和开发环境、高价值高奖金竞赛项目,支撑高校老师轻松实现AI教学,并助力开发者学习交流,加速落地AI业务场景ht.
2021-10-09 10:17:46 6551
原创 Ultra-Light-Fast-Generic-Face-Detector-1MB的自定义数据集训练 | PTH权重转为ONNX格式 (3)
在PTH格式不方便端侧部署,考虑转为ONNX或者MNN格式。1、修改源代码首先需要修改一下源代码:(1)vision/ssd/ssd.py这个文件里面if self.is_test: confidences = F.softmax(confidences, dim=2) boxes = locations # this line should be added. #boxes = box_utils.convert_locations_to_boxes( #
2021-09-22 15:14:07 390
原创 Ultra-Light-Fast-Generic-Face-Detector-1MB的自定义数据集训练 | 多分类推理修改 (2)
上一篇帖子我们介绍了如何修改源代码适应我们自己定义的数据集做一个多分类的目标检测任务。Ultra-Light-Fast-Generic-Face-Detector-1MB的自定义数据集训练 | 多分类修改指南_Andrwin的博客-CSDN博客训练好的权重会被保存在 项目根目录/models/train-version-RFB 这个文件夹里面,你可以根据训练日志选择损失最小的一个权重。第一件事是新建一个分类标签列表,看过上一篇博客的朋友可能不理解为什么又要新建一个列表,因为原始代码对于列表读取的
2021-09-22 13:55:31 489
原创 Ultra-Light-Fast-Generic-Face-Detector-1MB的自定义数据集训练 | 多分类修改指南 (1)
1、项目地址:https://github.com/Linzaer/Ultra-Light-Fast-Generic-Face-Detector-1MB/blob/master/README_CN.md2、虚拟环境按照requirements.txt安装就可以,我的硬件是RTX2080(8G),i7-9700K,32GRAM,Ubuntu18.043、数据集准备可以使用labelimg去标注,文件结构组织形式:\data|------\my_dataset ...
2021-09-22 10:06:18 626
原创 OCR/STR生僻字数据训练 | PaddleOCR的Fine-tune常见问题汇总(3)
1、印章如何识别?使用带tps的识别网络或abcnet,2.使用极坐标变换将图片拉平之后使用crnn2、多语言的字典里是混合了不同的语种,这个是有什么讲究吗?统一到一个字典里会对精度造成多大的损失?统一到一个字典里,会造成最后一层FC过大,增加模型大小。如果有特殊需求的话,可以把需要的几种语言合并字典训练模型,合并字典之后如果引入过多的形近字,可能会造成精度损失,字符平衡的问题可能也需要考虑一下。在PaddleOCR里暂时将语言字典分开。3、如何对检测模型finetune,比如冻结.
2021-09-18 10:01:37 7328
原创 OCR/STR生僻字数据训练 | PaddleOCR的垂类Fine-tune(2)
项目背景paddleOCR开源的权重识别的很好,但是不覆盖生僻字二级、三级字库,碰到个生僻字就翻车。研究一下发现paddleOCR提供了完整的训练和预测接口。项目地址:https://github.com/PaddlePaddle/PaddleOCR根据这个语焉不详的说明文档,我们开始训练起来吧~说明文档:https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.3/doc/doc_ch/recognition.md数据生成数据
2021-09-08 10:40:14 1475 5
原创 OCR/STR生僻字数据集生成 | PaddleOCR的垂类Fine-tune(1)
根据字库生成一个图片,图片里面约10多个字,白底黑字,字号大约6号:大概长这个样子首先找个字库再说:https://github.com/elephantnose/characters导入依赖包import cv2from PIL import ImageFont,ImageDraw,Imageimport numpy as npimport uuidimport osimport randomimport math配置函数,画图函数,生成函数def confi.
2021-09-07 17:12:39 1187 3
原创 百度飞桨PaddleHub | 词法分析
之前一直在用LTP的分词,偶然接触到了PaddleNLP,发现它的分词支持导入本地词典,决定试一下。首先安装paddlepaddlepip install paddlepaddle -i https://mirror.baidu.com/pypi/simple然后安装paddlehubpip install paddlehub -i https://mirror.baidu.com/pypi/simple然后安装lachub install lac==2.2.0Lexic
2021-08-13 13:59:37 623
原创 Python处理Json时自动转为单引号导致无法识别的问题
这不是自己给自己挖坑么?正规Json串是以双引号标识键值对的,python的dumps出来或者直接字典格式打印出来会变成单引号,写出来再读回去自己识别不了,被单引号赚了中间商差价。解决办法分为两种情况:(1) Json里面不包含中文:这个最好办了,直接~import jsonjson_str = json.dumps(json_str)(2)Json里面还有中文: 如果用上一种办法你会发现双引号倒是...
2021-08-11 15:32:54 3534 2
原创 地表最强编辑器Sublime | 正则表达式使用技巧
Ctrl+F 搜索Ctrl+H 替换打开 [.*] 按钮开始正则表达式:比较常用的有:^ 匹配开头$ 匹配结尾\n 换行\t 缩进\d 数字\d+ 任意个数字. 任意字符\w 除标点之外的字符(数字,字母,汉字)\s 空格,缩进,换行(隐藏字符)\u 或者 \l所有汉字变量:例如匹配138xxxxxxxx开头的串,且换行匹配:(138........)替换 \n$1每一对()代表一组数据,在替换里面$1就代表原数据第一组。执行后就.
2021-08-09 11:11:31 6028
range.rar 词频统计软件
2021-04-06
dataset_2.tar.gz
2020-04-20
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人