在使用pytesseract模块的image_to_string()功能时,识别出的结果总是带有这个向上的箭头和很多的换行符,如图。
尝试过将该符号替换成空格,但仍然会有很多空白的字符串被额外的解析出来(包括换行符),使用字符串替换的方法无法从根源解决问题,因此我尝试了使用各种版本的tesseract,4.0,5.0,5.0alpha等等,但都没用,至此我意识到可能是pytesseract库的问题。
出现问题时,使用的pytesseract库版本为0.3.5
解决方法:
1.先将原有pytesseract库使用pip uninstall pytesseract
删除
2.定向选择0.3.4版本下载pytesseract库pip install pytesseract==0.3.4
至此,图片转字符串解析正常。