计算机视觉
瑟荻
微信公众号 mad_coder
展开
-
CHEVP算法(Canny/Hough Estimation of Vanishing Points)
这个算法是汪悦在 Lane detection and tracking using B-snake中提出来的。他在这篇论文中主要用的是B-snake模型,这个模型的主要优点是鲁棒性好,可以针对不同的情景进行处理,而且他将检测道路两边的边缘的问题转化成求解道路中间线的问题。 下面主要描述一下CHEVP算法:边缘像素提取 我们使用Canny边缘检测来获得边缘映射和边缘定位映射。选择方差σ = 1翻译 2015-04-18 19:38:02 · 3319 阅读 · 2 评论 -
利用tesseract-ocr进行验证码识别
因为爬虫项目需要模拟登陆,可是有一个网站的登录需要输入验证码。其实这种登录有2种解决方案,一种是利用cookie,一种是识别图片。前者需要人工登录一次,而且有时效限制,故不太现实。后者可以,但是难点是如何识别出验证码。 这里面就要介绍一个神器了,tesseract-ocr这个项目是一个开源项目,可以用于图像识别。不过这个项目现在托管于google,所以不好下载,你可以搜一下,选择在国内下载。 一原创 2016-04-26 13:35:29 · 6905 阅读 · 0 评论 -
道路模型--linear-parabolic model
读过很多道路追踪的论文,经常都需要道路模型的建模。我不知道是不是因为自己太笨还是怎样,好多人建的模型我实在无法理解他的用意何在,而且我真的深刻怀疑他们那些模型的参数是不是真的可以求出来。就比如这篇文章“lane detection and tracking using a new lane model and distance transform”,我实在无法理解他的建模,还有他的建模参数到底如何求原创 2015-05-18 19:23:28 · 2210 阅读 · 2 评论 -
常用颜色的RGB分布
RGB色彩模式是工业界的一种颜色标准,它通过对红(RED)、绿(GREEN)、蓝(BLUE)三种基本颜色的相互组合从而叠加出各种颜色。RGB色彩模式为每一个红、绿、蓝分类了0-255范围内的亮度值。 RGB色彩模式通常RGB(0,0,0)的格式来表示颜色,括号中的3个数字分别表示红、绿、蓝的亮度值,常用的颜色的RGB颜色分布有以下这些:品红色 (255,0,255)蓝色 (0,0,255原创 2015-05-10 11:55:27 · 6681 阅读 · 2 评论 -
OPECV的配置
因为要做一点道路是别的东西,所以想用到OPENCV的一些东西。在网上找了一些OPENCCSHARP的代码,但是这方面的书籍或者资料还是不是特别的多,所以我就觉得可能还不是很好。主要的原因还是因为自己的懒惰,自己不太熟悉cpp,所以更加想做opencsharp,其实都一样,我觉得也是好机会,自己能够更好地熟悉cpp。写这个文章主要是为了提醒自己,以免以后及又遇到同样的问题。OPENCV配置的时候原创 2015-04-06 18:51:11 · 643 阅读 · 0 评论 -
Iplimage versus Mat
我们可能经常面临这样的困惑,Iplimage和Mat这两种数据结构,我们应该用哪一种数据结构。 Iplimage一开始就存在opencv库之中,他来源于Intel的另外一个函数库Intel Image Processing Library(IPL),这是一种非常重要的数据结构。在经典书籍里面的sample用的基本都是Iplimage这个数据结构。但是这是一种C风格的数据结构,你必须为他分配以及释放原创 2015-04-15 12:08:20 · 765 阅读 · 0 评论 -
道路识别demo
最近做的道路识别一开始终于弄懂了点东西,一开始在网上找到了一个简单的道路识别的opencvsharp的版本。我觉得opencvsharp真的是一个很好的东西,它封装了比opencv更多的数据结构和库,而且得益于.net平台的强大,使用起来也非常的便捷。唯一的缺点就是目前关于这方面的资料还是少之又少,后来我还是想一想把这个demo转换成cpp版本,也是一个非常简单的demo。opencvsharp版本原创 2015-04-15 09:55:48 · 7602 阅读 · 8 评论 -
opencv视频流的读取和处理
Opencv提供一个简单易用的框架以提取视频文件和USB摄像头中的图像帧,如果只是想读取某个视频,你只需要创建一个VideoCapture实例,然后在循环中提取每一帧。下面是一个简单的代码#include<opencv2\core\core.hpp>#include<opencv2\imgproc\imgproc.hpp>#include<opencv2\highgui\highgui.hpp原创 2015-04-12 13:16:58 · 14030 阅读 · 3 评论 -
关于计算机视觉研究
本文是UCLA教授朱松纯的见解,我翻译下作为见解,尽管以后不一定做这些东西,但我觉得这些道理还是有价值的。我们如何知道我们是不是在以错误的方式做研究? 视觉问题是一个在现代科学以及工程上一个非常具有挑战性和潜力的问题,因为它非常复杂并且包罗万象。对于如此复杂的一个问题,我们必须十分谨慎地选择一个长期有效的解决方案以免走入一个死胡同中。人们喜欢享受能够感觉到的进程,但实际地研究过程就回事十分枯燥无翻译 2015-04-11 12:44:04 · 733 阅读 · 0 评论 -
opencv配置经常遇到的错误
我们在运行一些书上的例子,经常会遇到以下的错误还有什么Assertion Failed错误。这些错误都是我运行浅墨树上的例子或者博客的例子上面的代码的错误,他自己也提了一下,但是说的不是特别的清楚,我想在这总结一下,这样以后再像我这样的菜鸟也不会问东问西搞不清楚,网上好多其他人也都说的不清不楚。第一个错误时你可能混合使用多个版本的lib或者依赖项,就好像我一开始环境变量设置的是64原创 2015-04-09 16:25:09 · 2342 阅读 · 0 评论 -
OPENCV
转载 尽管之前写过一篇关于OpenCV的介绍(http://blog.csdn.net/carson2005/article/details/5822149),但依然有朋友对其不甚了解。所以,经常能碰到有人问我诸如以下一些问题:OpenCV能不能实现人脸识别?OpenCV有没有车辆检测的API?OpenCV有没有三维重建的函数?面对这样的问题,我也很困惑。到底该如何给他们解释,才能让它们明白,Op转载 2015-04-11 11:22:35 · 638 阅读 · 0 评论 -
道路识别
我们老板希望我能在道路识别这个方面做一些东西,这方面的东西一直在看,但是一直都是模模糊糊,我希望自己能够用一个合适的方式总结一下道路识别的问题。道路识别问题其实也正正恰好是识别问题中的一个方面,所以道路识别问题的关键也是在于如何选取一个特征来进行识别。道路识别问题可以使用不同的方法来解决,我打算从下面这些方面来阐述一下我自己对道路识别的一个理解:我们要解决什么情况下的道路问题 其实我觉得这点挺重原创 2015-04-11 13:29:14 · 7186 阅读 · 9 评论 -
聊聊答题应用题库的建立
前段时间,答题 APP 如火如荼的发展,各大互联网公司都加入了撒币大战,包括像冲顶大会,百万英雄,芝士英雄等等。随之而来的也是各个答题应用辅助的兴起。网上已经有不少答题应用的辅助,一般来说包括两个步骤,即获取题目选项以及搜索答案。对于题目以及选项的获取包括利用 adb 抓取手机屏幕截图,然后使用 ocr(optical character recognization) 的方式去识别题目和选项。...原创 2018-02-23 22:30:09 · 754 阅读 · 0 评论