自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 前端开发记录

常见问题1:vw、vh、%、em、rem之间的区别: 1子元素设置em,大小是取决于父元素的字体大小的 2元素的width,height,margin,padding用em的话是取决于该元素的font-size的大小。 3em的继承效果,每个元素都自动继承其父元素的字体i大小 4只要父级元素及上面一直有font-size为em单位,则会一直集成,但假如自己设置了font-size的单位为px的时候,则会直接使用自己的px值 5rem是css3新引进的一个度量单位,rem的长度是相对于根元素,即

2024-06-06 10:06:02 246

原创 labelme标注工具安装

安装labelme标注:参考https://blog.csdn.net/lidichengfo0412/article/details/109508113,很好的文章 运行的时候可能会numpy版本太新报错:参考https://blog.csdn.net/lidichengfo0412/article/details/109508113,解决

2020-11-26 11:28:29 161

原创 kmp

2020-11-07 21:31:39 126

原创 advancedeast认识

传统的EAST的约束:长文本识别效果不理想 EAST的损失函数是类平衡交叉熵损失和smoothL1损失 score分数很高,应该跟loss很小有关,所以不能小于一个阈值,把图缩小没有效果 小于0.9的重新检测与识别 vgg方案不是很可行,因为他们的感受野都是3x3(考虑感受野,可以把最后一层换成7x7,或者更大) 基于回归框anchor的方法,减少精度损失,尽量回归出文本框 作者在EAST网络框架的基础上巧妙地设计了基于文本边界框的损失函数,将长文本检测的问题转换为检测文本头部和尾部边界区的问

2020-11-03 10:51:57 902 3

原创 iou与giou

衡量目标检测定位性能的主要指标是交并比iou,我们在设计损失函数的时候通常是使用mse等损失函数来优化模型对目标的定位结果,但是这类损失函数并不能够良好的反应定位精度。 对iou的认识:可以反应预测检测框与真实框的检测效果,有一个很好的特性是尺度不变性也就是对尺度不敏感,在回归任务重判断predict box和gt的距离最直接的指标就是iou(满足非负性,同一性,对称性,三角不等性)。作为损失函数会出现的问题是:如果两个框没有相交根据定义iou=0,不能反应两者之间的距离大小,同时loss=0,没有梯度回

2020-11-02 16:46:16 2350

原创 advancedeast理解

数据集准备,作者是在EAST模型上增加了对长文本的检测,所用数据集为icpr2018,标记为4个坐标点(8个坐标值) 数据集处理,proprecess.py,对文本进行画框处理,label.py,进行区域的缩放和头尾部的标记 训练,advanced_east.py,训练入口,加载模型(loss=quad_loss自定义损失函数,Adam激励函数,此处没有mertice?) 训练补充,先有一个vgg16预训练模型放到.keras(我的是在c盘//用户)文件下,然后在下载的项目文件下有一个save_mod

2020-09-28 10:56:41 590

原创 concat

2020-07-02 10:01:49 121

原创 大概的几种文本检测算法了解

1、(2016)CTPN,基础网络框架:VGG16,BLSTM利用图像上下文的信息特征,FC,支持水平和倾斜文本的检测 《Detecting text in natural image with connectionist text proposal network》 2、(2017)EAST,基础框架:基于PVANet的FCN、多尺度融合之后,直接进行像素级的文本块检测,没有RPN,单词分割,子块合并等,故速度很快。 《East: An efficient and accurate scene tex

2020-05-20 10:20:16 1982

原创 chinesesocr的环境搭建和运行过程记录

前提:nvidia显卡,安装的是nvidia的驱动器,cuda8.0,cudnn5.1,借助的是anaconda(搭建自己需要的环境真的方便很多)然后运行该程序的时候需要找对应的tensorflow-gpu版本为1.2.0版本,还有对应tensorflow的keras版本为2.1.1(本人安装)/2.0.6,这个keras版本查了很多,我的主要环境搭建问题就是这两个的版本对应问题,还有一个是torch的问题(一直按这下载的命令走的),但最后运行程序的时候提醒只是torch对不上,就只安了torch1.5版本

2020-05-17 19:09:34 1924 7

原创 分水岭算法

分水岭变换是一种流行的图像处理算法,用于快速将图像分割成多个同质区域。 分水岭算法的思想是:把图像看成一个拓扑地貌,那么同类区域就相当于陡峭边缘内相对平坦的盆地。 分水岭算法通过逐步增加水位,把地貌分割成多个部分(目前比较著名的有模拟泛洪和降水)。 降水:水先是汇集到海拔低的地区,慢慢填充这每一个盆地(低洼区域),直至水位差一线之隔就可以和另一个盆地汇合的时候,这个一线之隔的一线就是分割线。...

2020-05-16 09:27:58 357

原创 PCA-SIFT新手总结记录

PCA(Principal Components Analysis)即主成分分析,是几种降维的方法之一,经常应用在图像处理方面。 它和SIFT的联系是:前面几步,先是高斯模糊,建立高斯金字塔和高斯差分金字塔,然后最值的选择,排除边缘不稳定点和剧变不够激烈的点。最后一步SIFT使用4X4X8=128维进行描述,运用PCA算法小于128维对该特征点进行描述。 降维的主要思想是:一个样本可以由很多属...

2020-05-16 09:25:48 395

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除