爬虫
sherpahu
这个作者很懒,什么都没留下…
展开
-
Python 爬虫:2.几个爬虫实例
#百度搜索全代码import requeststry: kv={'wd':'Python'} r=requests.get('http://www.baidu.com/s',params=kv) print(r.request.url) r.raise_for_status() print(len(r.text))except: print('...原创 2018-02-27 11:39:13 · 5198 阅读 · 0 评论 -
tesseract-oct库安装,再结合pytesseract对于图像的OCR识别
操作环境:1.tesseract-ocr 4.00.002.PIL库3.pytesseract库4.Python 3.6一、(1)tesseract-ocr库的下载:这是一个谷歌的开源引擎,使用效果比较好笔者在下载该库时踩坑颇多,从https://digi.bib.uni-mannheim.de/tesseract/上面下载后即可安装.这里面没有带上dev的是稳定版本,带dev的是实验版然而安装速...原创 2018-05-20 11:44:30 · 2935 阅读 · 2 评论 -
Python实现Github下载工具
Github单个文件没有下载的按钮,在知乎上看到过一些下载方法链接,gitzip必须得一个一个文档双击,并且不能一次性下载一个文件夹,downzip有时候却是下载失败(当然通常情况还是挺好用的),参考大神的第三种方法,找raw文件地址,我这里通过Python爬虫自动完成整个网页中文档或文件夹的下载import requestsimport refrom urllib.request im...原创 2018-07-12 21:55:02 · 6306 阅读 · 3 评论