Python
文章平均质量分 73
Five?seven
这个作者很懒,什么都没留下…
展开
-
selenium自动登入爬取中国气象数据网
selenium自动登入爬取中国气象数据网记录主要遇到的难点与好的参考文献全部用到的库pytesseract识别验证码1.tesseract需要添加环境变量,不想添加的话可以直接2,识别前对图像进行,二值化,去噪等处理3.自己进行训练方法——tesseract-ocr4.识别验证码部分整个代码弹窗状态的判定第一种弹窗第二种弹窗cookie完整代码如下: 记录主要遇到的难点与好的参考文献 url = ‘http://data.cma.cn’ 难点: (1)验证码采用pytesseract库识别,正确率太低,如原创 2021-01-19 15:05:04 · 814 阅读 · 2 评论 -
SETUP.PY
SETUP.PYsdistinstalldevelop新命令 sdist python setup.py sdist #打包 install 安装 和install_requires develop python setup.py develop python setup.py develop -u 新命令 …entry_points=’’’ [distutils.commands] my_command=my.command.module.Class ...原创 2020-12-14 22:01:32 · 84 阅读 · 0 评论