安装Tesseract:
下载网址:https://github.com/UB-Mannheim/tesseract/wiki
下载完成后
点最后一个安装
把路径设置成系统变量,名字也要变:TESSDATA_PREFIX =
安装pytesseract
pip install pytesseract
直接在cmd里测试 :tesseract 图片名.png 识别保存文件(自设置)from selenium import webdriver
import time
driver = webdriver.PhantomJS()
driver.get("https://movie.douban.com/typerank?type_name=剧情&type=11&interval_id=100:90&action=")
time.sleep(3)
# 向下滚动10000像素
js = "document.body.scrollTop=10000"
#js="var q=document.documentElement.scrollTop=10000"
#查看页面快照
driver.save_screenshot("douban.png")
# 执行JS语句
driver.execute_script(js)
time.sleep(10)
#查看页面快照
driver.save_screenshot("newdouban.png")
driver.quit()