- 博客(6)
- 资源 (1)
- 问答 (1)
- 收藏
- 关注
原创 pyppeteer报错解决和相关问题解决
pyppeteer.errors.NetworkError: Protocol Error (Runtime.callFunctionOn): Session closed. Most likely the page has been closed.使用pyppeteer采集京东的时候,总数到7~8页的时候就报错.谷歌发现了这样的解决方案:https://github.com/miyako...
2019-01-31 18:01:01 28650 4
原创 python使用pupeteer的一些姿势
# 运行浏览器browser = await pyppeteer.launch( executablePath="/home/nick/.local/share/puppeteer/local-chromium/609904/chrome-linux/chrome", headless=False, args=['--proxy-server=11...
2019-01-29 17:39:59 5066
原创 使用pyppeteer调用puppeteer访问页面
pyppeteer文档:https://miyakogi.github.io/pyppeteer/index.html参考:https://www.jianshu.com/p/fd9eb385a70e1 安装pyppeteerpip install pyppeteer2 配置puppeteer和chrome要使用python调用puppeteer前当然先要把chrome内核和dri...
2019-01-28 13:32:00 6581
原创 使用node运行puppeteer项目
1 初始化node项目新建一个目录,在目录下运行:sudo npm init2 安装puppeteer安装puppeteer,由于下载chrome内核比较慢,这里使用--ignore-scripts参数忽略下载chrome内核sudo npm i puppeteer --ignore-scripts -S 3 下载chrome内核内核下载地址如下:const downloadU...
2019-01-28 11:27:07 5065
转载 (转贴)git subtree用法
一.使用场景例如,在项目Game中有一个子目录AI。Game和AI分别是一个独立的git项目,可以分开维护。为了避免直接复制粘贴代码,我们希望Game中的AI子目录与AI的git项目关联,有3层意思:1.AI子目录使用AI的git项目来填充,内容保持一致。2.当AI的git项目代码有更新,可以拉取更新到Game项目的AI子目录来。3.反过来,当Game项目的AI子目录有变更,还可以推送这些...
2019-01-08 12:27:04 2283
原创 使用tesseract识别采集到内存中的图片+解决tesseract不识别最左侧字符的问题
本文主要介绍两个问题:如何把网页上采集的图片不存到本地直接在内存中识别使用image = BytesIO(response.content)转换为流数据解决tesseract不识别最左侧字符的问题参数中加上config="--psm 6 --oem 3 -c tessedit_char_whitelist=0123456789"然后直接贡献出代码:#!/usr/bin/python...
2019-01-04 23:34:16 6049 5
如何建立自己的代理IP池,并持续维护?
2017-10-16
TA创建的收藏夹 TA关注的收藏夹
TA关注的人