Python
浦东_攻城狮
本站(https://how2j.cn?p=944)服务
展开
-
Python爬虫:3.8版本 解决lxml包没有etree模块问题
背景最近用爬虫爬网页需要用到lxml包中的etree模块。我的pycharm中已经内置了lxml包最新的4.2.4版,然而这个版本居然丢掉了etree模块。搜了网上各种解决方法,搞定了这个问题。然后就开始使用了...原创 2020-03-25 11:10:40 · 6190 阅读 · 6 评论 -
PDF文件移动
网站链接:Java全栈工程师 | 以实例驱动学习 | how2j.cn#!/usr/bin/env python# coding: utf-8# 读取HTML文件夹中的.html文件import os# html的路径html_dir = 'C://2010html'# pdf的路径pdf_dirs = 'C://2010'# 已转换完新建存储的路径old_pdf = '...原创 2020-03-16 10:43:35 · 342 阅读 · 0 评论 -
Pycharm中批量添加单引号,双引号的方法(爬虫Headers中批量加引号)
爬虫项目时候,经常需要复制脚本中的Headers中的数据,一般作为字典使用,需要添加大量的引号,如何快速添加了,具体步骤如下:第一步:Ctrl+R 调出正则匹配工具栏第二步:填写正则表达式第一行填写:(.*?)\:(.*?)\n第二行填写:'$1':'$2',\n第三步:勾选Match Case Regex In Selection**第四步:**选择要添加单引...原创 2019-05-24 15:13:45 · 11490 阅读 · 4 评论 -
Python爬虫:lxml包没有etree模块的解决方法
背景最近用爬虫爬网页需要用到lxml包中的etree模块。我的pycharm中已经内置了lxml包最新的4.2.4版,然而这个版本居然丢掉了etree模块。搜了网上各种解决方法,搞定了这个问题。解决步骤第一步:检查你的python版本。我的pycharm中配置了python2.7和python3.7两个解释器,请用这两种解释器的小伙伴放弃挣扎......请下载python...原创 2019-04-19 10:42:07 · 11444 阅读 · 14 评论 -
Scrapy运行ImportError: No module named win32api错误
windows系统上出现这个问题的解决需要安装Py32Win模块,但是直接通过官网链接装exe会出现几百个错误,更方便的做法是pip install pypiwin32原创 2019-04-17 11:34:25 · 155 阅读 · 0 评论 -
安装Python scrapy会遇到的问题
一、需要安装twisted,可通过wget https://pypi.python.org/packages/source/T/Twisted/Twisted-15.2.1.tar.bz2获取,然后tar -xjvf Twisted-15.2.1.tar.bz2 进行解压注意在解压是可能会遇到tar (child): lbzip2: Cannot exec: No such file or...原创 2019-04-04 16:51:44 · 267 阅读 · 0 评论 -
WebDriverWait 显示等待 +lambda匿名函数
selenium中的三种等待方式(显示等待WebDriverWait()、隐式等待implicitly()、强制等待sleep())sleep后会影响脚本的执行速度,虽然implicitly_wait()这种方法隐式等待方法一定程度上节省了很多时间。但是一旦页面上某些js无法加载出来(其实界面元素经出来了),左上角那个图标一直转圈,这时候会一直等待的。一、参数解释(WebDriverWai...原创 2019-03-21 21:22:25 · 2437 阅读 · 0 评论 -
Python的while语句(True,continue,break)
while条件循环i = 1while i <= 10: print(i) i += 1输出结果:12345678910while 语句”判断条件”还可以是个常值/True,表示循环永远进行下去,需要break跳出循环。i = 1while True: print('Hello Python!') i += 1 ...原创 2019-03-21 20:47:27 · 16584 阅读 · 0 评论 -
Python 中__init__函数以及参数self
Java网站链接:Java全栈工程师 | 以实例驱动学习 | how2j.cn1)class类包含:类的属性:类中所涉及的变量类的方法:类中函数2) __init函数(方法)1、带有两个下划线开头的函数是声明该属性为私有,不能在类地外部被使用或直接访问。2、init函数(方法)支持带参数的类的初始化,也可以为声明该类的属性3、init函数(方法)的第一个参数必须是sel...转载 2019-02-23 17:29:36 · 26069 阅读 · 6 评论 -
python操作Excel读--使用xlrd
一、使用介绍 1、导入模块 import xlrd 2、打开Excel文件读取数据 xls_file = r'C:/Users/Desktop/1_1.xlsx' book=xlrd.open_workbook(xls_file) #得到Excel文件的book对象,实例化对象 3、使用技巧...原创 2018-08-15 15:29:53 · 247 阅读 · 0 评论 -
python之r的作用
python中的正则表达式中经常会有 r 这个字符比如r'abc'这是因为有时候匹配正则表达式中,有时候会有斜线 \ 没有 r ,就要写2个 \ \ 有 r ,只要写一个 \ ...转载 2018-08-15 15:07:26 · 7656 阅读 · 1 评论 -
Python3.5的pip安装
1.下载pip的压缩包,解压网址:pypi.python.org/pypi/pip#downloads2.打开cmd,跳转到pip文件夹所在目录,通过cmd安装pip输入:python setup.py install3.环境变量设置找到Python3.5中Scripts文件的目录,填入环境变量path中,才算安装完成4.成功后在cmd中输入pip...原创 2018-07-06 16:24:14 · 10058 阅读 · 6 评论 -
Python3.5安装gevent模块
Java自学的网站(Java全栈工程师 | 以实例驱动学习 | how2j.cn)学到协程,需要安装gevent模块好greenlet模块,于是开始查资料。先pip install wheelpip install gevent就可以了。有时候用pip3不行,就换成pip试试。如果还不行的话,在Python编译环境下找到lib然后再找到site-packages,再找...原创 2018-07-09 21:05:15 · 2869 阅读 · 0 评论 -
Python中的除法
Python中分为3种除法:传统除法、精确除法、地板除。传统除法print(10/3) 输入结果:3.3333333333333335精确除法即使是两个整数恰好整除,结果也是浮点数:print(9/3) 输入结果:3.0地板除两个整数的除法仍然是整数print(9//3) 输入结果:3你没有看错,整数的地板除//永远是整数,即使除不尽。要做精确的除法,使用/就可以。因为...原创 2018-06-01 17:33:45 · 16162 阅读 · 0 评论 -
Python:TypeError: unorderable types: str() >= int()
Java自学的网站(Java全栈工程师 | 以实例驱动学习 | how2j.cn)1.问题描述age =input('please enter your age:' )if age >= 18: print('adult')else: print('teenager')在运行该代码的时候,python解释器报错,错误信息如下:Traceback (mos...原创 2018-06-01 14:38:33 · 6063 阅读 · 0 评论