1.lxml pip3 install lxml
2.beautifulsoup4 pip3 install beautifulsoup4
3.pyquery pip3 install pyquery
4.tesserocr
sudo apt-get install -y tesseract-ocr libtesseract-dev libleptonica-dev
我们查看一下其支持的语言
tesseract --list-langs
结果显示只支持几种语言,若想安装多国语言,就需要安装tessdata(github上面搜)
ubuntu系统下的迁移命令
sudo mv tessdata-4.0.0/* /usr/share/tesseract-ocr/tessdata
查看一下所有支持的语言
tesseract --list-langs
安装tesserocr 和pillow
pip3 install tesserocr pillow
爬虫解析库的安装
最新推荐文章于 2023-06-12 10:22:01 发布