Python
文章平均质量分 68
jcpp9527
这个作者很懒,什么都没留下…
展开
-
Python PDF转Images -- pdf转图片
一、环境安装windows环境:安装1:pdf2image: pip install pdf2image安装2:手动下载一个软件到本地poppler for Windows不然会出现not install poppler or not in PATH错误linux环境:安装pdf2image: pip install pdf2image安装pdfTools:sudo yum install poppler-cpp-devel二、使用pdf2image使用...原创 2021-10-22 14:56:25 · 1623 阅读 · 0 评论 -
关于linux定时任务crontab运行PYTHON脚本不生效,但是手动执行却正常的问题
运行crontab定时作业里边的东西,都要写绝对路径,python环境最好也写绝对路径0 10 * * * /usr/bin/python /opt/uhb.py 每天10点执行原创 2021-08-18 18:15:18 · 4023 阅读 · 1 评论 -
Python2.7升级到3.6 爬坑指南、多版本并存指南
centos7自带python2,由于执行yum需要python2,所以即使安装了python3也不能删除python20.安装依赖包yum -y groupinstall "Development tools"yum -y install zlib-devel bzip2-devel openssl openssl-devel ncurses-devel sqlite-devel readline-devel tk-devel gdbm-devel db4-devel libpcap-deve.原创 2021-08-17 19:02:33 · 1463 阅读 · 0 评论 -
Python 爬虫开发杂记之(二)Pycharm中新建项目与Python的配置
一、Pycharm的安装与使用。pycharm安装就不多说了,这里说说使用。1.创建新项目2.选择项目类型。选择python类型 ==> Pure Python并把Location的配置改一下,一般不要选择c盘,比如D:\py_charm_workspace,这个路径是项目存放的地方。最好是带上项目名称,比如项目名为learn,则填上:D:\py_charm_wo...原创 2018-09-08 13:21:16 · 2071 阅读 · 1 评论 -
Python 爬虫开发杂记之(三)Pycharm初始----编辑脚本和运行
前篇文章介绍了PyCharm的基本使用,接下来我们的脚本代码都在这个PyCharm这个编辑器里写。好处有很多,项目文件结构层次清晰,写代码的时候会自动化提示和补全。这里,我们在昨天创建的项目下,新建一个包,然后在包下面新建一个demo.py文件。抄写以下代码到你的环境里,尝试运行下,看看有没有问题。关于Python中类和函数及方法的调用,我们写在这个demo.py文件,具体代码如下:# ...原创 2018-09-08 14:21:53 · 554 阅读 · 0 评论 -
Python 爬虫开发杂记之(四)Python爬虫学习章节
本文基于 Python3 网络爬虫开发实战这本书在前面三章的基础上,由于对于爬虫的基本知识了解,所以略过第二章。对于第三章、第四章一直到第十一章这里不多阐述,按书上操作即可,书上的源码见网盘本文结束.... ...原创 2018-09-08 18:32:19 · 274 阅读 · 0 评论 -
Python 爬虫开发杂记之(五)pyspider框架安装
一、基于Anaconda安装pyspider在Anaconda中安装pyspider无法成功,请跳过第一部分,直接看第二部分的基于python目录安装在anaconda环境下,所以就出了一点小问题。首先输入pip安装命令,不能用 conda install pyspider 命令,会报错找不到包pip install pyspider执行pip install pyspide...原创 2018-09-08 20:12:08 · 2030 阅读 · 0 评论 -
Python 爬虫开发杂记之(六)安装phantomjs爬的坑
一、前言电脑环境基于前面几篇。anaconda3_5.2.0+python3.6在这里学习 Python3 网络爬虫开发实战 这本书第十二章 pyspider框架的使用时,发现少安装了个phantomjs二、错误安装按照Python3 网络爬虫开发实战这书上第一章1.2.5节上的完全不行,pyspider启动时,phantomjs根本就起不来。三、正确安装不需要配置任何环境...原创 2018-09-08 23:17:23 · 376 阅读 · 0 评论 -
Python 爬虫开发杂记之(七)pyspider框架使用教程
具体去学习 Python3 网络爬虫开发实战 第十二章,很详细...原创 2018-09-08 23:19:26 · 381 阅读 · 2 评论 -
Python 爬虫开发杂记之(八)pyspider框架将数据写入Mysql
一、不写入Mysql根据 Python3 网络爬虫开发实战 (崔庆才著)这本书第十二章第二节的教程中去爬去哪儿网的攻略。以下是完整的脚本:from pyspider.libs.base_handler import *class Handler(BaseHandler): crawl_config = { } @every(minutes=2...原创 2018-09-09 10:21:36 · 2304 阅读 · 1 评论 -
Python 爬虫开发杂记之(九)scrapy框架安装和使用
一、安装scrapy按照书上的来就行了,这里采用的是Anaconda来安装这样就可以了 ,不需要安装其它的什么,在简单应用的场景下以下的不需要安装,有需要就要安装二、使用教程请参考书上第十三章即可...这里不多说了...书上说需要IDE--集成开发环境(IDE,Integrated Development Environment ),有一个notepad++编辑py文件...原创 2018-09-09 11:05:51 · 243 阅读 · 0 评论 -
Python 爬虫开发杂记之(一)python环境安装与Anaconda入门指南
一、安装Python环境这里只说windows下的安装,更多请阅读Python3 网络爬虫开发实战这本书我自己安装的是20180908最新的Anaconda,版本号为Anaconda3-5.2.0-Windows-x86_64.exe按照提示来安装,安装中不要画蛇添足自己去勾选选项,都是默认选项即可...第二种安装包安装的详情请见文首的那本书,就不多说了。这篇主要是...原创 2018-09-08 00:06:23 · 1539 阅读 · 1 评论