![](https://img-blog.csdnimg.cn/20201014180756918.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
软件使用点滴
jingxinren
这个作者很懒,什么都没留下…
展开
-
freebsd(unxi)下thrift的安装
最近使用到thrif,简单总结一下安装过程,其实通过ports和pkg方式更方便。参考 http://blog.csdn.net/zhangxue/archive/2008/11/11/3274732.aspx操作系统环境:FreeBSD依赖库:libevent 、boost、zlib thrift:http://www.thrift-rpc.org/?p=thrift.git;a原创 2010-04-29 13:30:00 · 828 阅读 · 0 评论 -
Tesseract-OCR3.0使用
近来由于工作需要,对开源的orc引擎Tesseract做了简单的应用,需求是识别网站图片电话,如locoso、koubei、qingke800等网站 针对不同的站点,采用不同的策略。简单的方法是只要对图片转格式(tif)后做一定比例的放大就可以识别(因站点而易),例如locoso的图片做200%的放大比例后,几乎可以100%识别。而对于koubei尝试了几个比例后,效果不是很理想,所以针对这个站点做了专门的训练语集,训练数据集的生成方法参见看考链接,我做的训练语集对koubei可以达到99%多原创 2010-12-30 22:28:00 · 6222 阅读 · 3 评论