![](https://img-blog.csdnimg.cn/20201014180756923.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
crawl
文章平均质量分 79
TechnologyShare
这个作者很懒,什么都没留下…
展开
-
Python使用Pillow和Tesseract识别图片文字
概述图像识别与文字处理是在生活中非常常见的一种场景,Python对于处理该问题有很多相关库来使用,这次用到两个非常重要的库:Pillow和Tesseract。这两个库互为补充,对互联网上的图片进行处理。Pillow执行第一步:清洗和过滤图像,Tesseract尝试将图像中的形状与库里面存储的文字相匹配。Tesseract安装需要配置环境变量,接下来演示下Tesseract安装过程:Tesseract下载地址:https://digi.bib.uni-mannheim.de/tesseract/接原创 2021-06-19 23:02:41 · 857 阅读 · 0 评论 -
Scrapy爬虫框架结构及实例
Scrapy框架Scrapy介绍爬虫相关框架有很多,scrapy是目前python中使用最广泛的框架,主要是它的相关扩展组件很多,可配置和可扩展性非常高。Scrapy是一个基于Twisted的异步处理框架,是纯python实现的爬虫框架,使用它我们只需定制开发几个模块就可以轻松实现一个爬虫。Scrapy框架组件,数据流及项目结构介绍1.组件Engine: 引擎,处理整个系统的数据流处理,触发事务,是整个框架的核心。item: 项目,它定义了爬取结果的数据结构,爬取的数据会被赋值成该item原创 2021-06-06 21:57:59 · 696 阅读 · 0 评论