图像处理
文章平均质量分 80
yuanlulu
做过嵌入式Linux开发、深度学习平台开发。擅长c++和python。
展开
-
使用opencv的透视变换裁剪倾斜人脸
人脸检测以后,有了检测框,需要将眼睛扶正,并裁剪,然后resize成需要的大小。人脸检测结果如下:其中蓝色是检测框,内部的红色框是我根据长宽扩展的正方形,绿色框是根据眼睛倾斜角度计算的正方形区域,我需要的就是这个区域。为了得到绿色方框的区域。可以看到上述方法包含两次裁剪和一次旋转。这不是一个好的方案。经过搜索,我了解到opencv里还有透视变换函数cv::warpPerspective, 可以用一个函数替代上述一连串操作,而且速度还快(我是在arm上做的测试)。.........原创 2022-08-16 09:56:21 · 2294 阅读 · 0 评论 -
使用pyav访问网络视频流
背景深度学习项目中使用python-opencv获取视网络频流出错,找替代方案.要求能得到numpy格式的图片,供opencv和深度模型使用。方案选型据我所知道的方法,在python中访问网络视频流(rtsp 或者http视频流)有以下工具:opencv、pyav、imageio和python-vlc.imageio和python-vlc的资料少,没找到完美的例子,放弃。 o...原创 2018-06-26 20:50:48 · 15209 阅读 · 0 评论 -
python-opencv的学习资源
概述自己平常用python调用opencv,遇到问题往往求助官方手册 和网络上的资源。 自己也想过去翻译opencv的”OpenCV-Python Tutorials”,但是自己对opencv研究不深,始终未付诸实践。目前发现已经有高人把这个工作做完了。python_opencv例程及中文Tutorials有位高人已经做了opencv官方文档的翻译,把文档和代码都放在了githu...原创 2018-07-02 20:44:37 · 1537 阅读 · 0 评论 -
opencv目标跟踪概述和人脸跟踪
概述opencv内部实现了一些单目标跟踪算法,可以很方便的使用。这里说的目标跟踪不是多目标跟踪,往往是需要人工或程序给定初始目标位置。资源及跟踪算法介绍目前看到的比较好的opencv目标跟踪算法资源在这里:https://www.learnopencv.com/object-tracking-using-opencv-cpp-python/这个页面介绍了几个常用的跟踪算法:...翻译 2018-07-03 16:04:39 · 6597 阅读 · 2 评论 -
机器视觉特征提取介绍:HOG、SIFT、SURF、ORB、LBP、HAAR
一. 概述这里主要记录自己的一些感悟,不是很系统。想要详细系统的理论,请参考文末的《图像处理之特征提取》。个人不是专业cv工程师,很多细节没有深究,描述可能不严谨。 在总结物体检测算法之前先把基础的特征点理论整理一下。二. HOG求取前先灰度化然后Gamma校正,降低图像局部的阴影和光照变化所造成的影响,同时可以抑制噪音的干扰。HOG主要捕获轮廓信息。统计每个cell的梯...原创 2018-08-28 15:15:14 · 49050 阅读 · 6 评论 -
Tesseract-OCR批量标注及合并数据集的一种思路
背景Tesseract标注训练最根本的文件是两个:tiff文件(存储图片)及box文件(标注字符值和位置)一般tiff用命令合成,box文件用jTessBoxEditor生成。背景知识参考前一篇博客,可以用python读写tiff文件。另外box每一行的格式如下(6个元素):tag x y w h frame-numtag即OCR识别后的字符的值,(x,y,w,h)是左上角坐标及长...原创 2018-10-22 22:25:38 · 4284 阅读 · 0 评论 -
磁盘图片到numpy的两种方法:一次意外的优化
概述在优化代码时意外将图片读取的效率提升了60倍。主要就是在python下把磁盘图片变为numpy数组。低效方法:PIL和numpy组合import numpy as npfrom PIL import Imagedef load_image_into_numpy_array(image): (im_width, im_height) = image.size ret...原创 2018-12-31 14:43:48 · 594 阅读 · 2 评论 -
python_opencv--身份证文字区域检测
概述本文基于opencv的形态学滤波检测身份证上的文字位置。如果是自然场景的文字检测可以用CTPN或者EAST。我这里是身份证合成照片,没有多余背景,也没有复杂光照,所以就用最简单的办法。代码import sysimport numpy as npimport cv2def test_detect (img_path): # 参考:https://blog.csdn.n...原创 2019-01-16 20:43:51 · 6396 阅读 · 7 评论 -
基于语义分割的身份证部件解析和文字检测
概述这个工作主要是利用人脸解析项目的算法,探索一下语义分割的功能。安排实习生利用合成的身份证照片进行了语义分割的标注。我的目的有两个:1.检测身份证上的信息是否齐全;2.确定身份证各文字信息的位置,把文字抠出来给OCR程序。基于opencv的算法之前写过一篇文章《python_opencv–身份证文字区域检测》,利用opencv的接口进行二值化,然后找出所有的阴影对应的外接矩形。这个方法...原创 2019-05-10 18:09:42 · 5004 阅读 · 9 评论