- 博客(3)
- 收藏
- 关注
原创 selenium自动登入爬取中国气象数据网
selenium自动登入爬取中国气象数据网记录主要遇到的难点与好的参考文献全部用到的库pytesseract识别验证码1.tesseract需要添加环境变量,不想添加的话可以直接2,识别前对图像进行,二值化,去噪等处理3.自己进行训练方法——tesseract-ocr4.识别验证码部分整个代码弹窗状态的判定第一种弹窗第二种弹窗cookie完整代码如下: 记录主要遇到的难点与好的参考文献 url = ‘http://data.cma.cn’ 难点: (1)验证码采用pytesseract库识别,正确率太低,如
2021-01-19 15:05:04 572 2
原创 SETUP.PY
SETUP.PYsdistinstalldevelop新命令 sdist python setup.py sdist #打包 install 安装 和install_requires develop python setup.py develop python setup.py develop -u 新命令 …entry_points=’’’ [distutils.commands] my_command=my.command.module.Class ...
2020-12-14 22:01:32 79
原创 stata:2020-12
stata问题的记录资料版本的选择功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入 资料 word和PDF混合,PDF不清晰,通过PDF转excel然后人工收条得到一系列CSV文件。 版本的选择 我们对Markdown编辑器进行了一
2020-12-09 22:54:58 184 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人