处理图像不是一项简单的任务。对你来说,作为一个人,很容易看着某样东西然后马上知道你在看什么。但电脑不是这样工作的。
对你来说太难的任务,比如复杂的算术,或者一般意义上的数学,是计算机毫不费力就能完成的。但在这里,情况正好相反——对你来说很琐碎的任务,比如识别图像中的猫或狗,对电脑来说真的很难。在某种程度上,我们是天造地设的一对。至少现在是这样。
虽然图像分类和涉及到一定程度计算机视觉的任务可能需要大量的代码和扎实的理解,但是从格式良好的图像中读取文本在Python中却是简单的,并且可以应用于许多现实生活中的问题。
在今天的帖子中,我想证明这一点。虽然会安装一些库,但不会花很多时间。这些是你需要的库:
- OpenCV
- PyTesseract
OpenCV
现在,这个库将只用于加载图像,实际上你不需要事先对它有太多了解(尽管它可能有帮助,你将看到为什么)。
根据官方文件:
OpenCV(开源计算机视觉库)是一个开源的计算机视觉和机器学习软件库。OpenCV的目的是为计算机视觉应用提供一个通用的基础结构,并加速机器感知在商业产品中的使用。OpenCV是bsd许可的产品,OpenCV使企业可以轻松地使用和修改代码
简而言之,你可以使用OpenCV来做任何类型的图像转换,这是一个相当简单的库。
如果你还没有安装它ÿ