python
work_you_will_see
这个作者很懒,什么都没留下…
展开
-
关于python 的re.sub用法
import retext = “JGood is a handsome boy, he is cool, clever, and so on…”print(re.sub(r’\s+’, ‘-’, text))JGood-is-a-handsome-boy,-he-is-cool,-clever,-and-so-on…print(re.sub(r’is\s+’, ‘-’, text)...转载 2018-11-29 16:45:57 · 620 阅读 · 0 评论 -
python 中join()函数strip() 函数和 split() 函数的详解及实例
1、join()函数Python中有join()和os.path.join()两个函数,具体作用如下:join(): 连接字符串数组。将字符串、元组、列表中的元素以指定的字符(分隔符)连接生成一个新的字符串语法: ‘sep’.join(seq)参数说明sep:分隔符。可以为空seq:要连接的元素序列、字符串、元组、字典上面的语法即:以sep作为分隔符,...转载 2018-11-29 17:02:20 · 679 阅读 · 2 评论 -
AttributeError: 'lxml.etree._Element' object has no attribute 'translate'
此处的错误是我在利用lxml下的etree爬取拉勾网时出现的错误方法: 把你要爬取的内容用print输出一遍看看是不是存在json数据代码如下:positionName=html.xpath("//div[@class=原创 2018-11-29 17:46:31 · 25503 阅读 · 1 评论 -
Selenium webdriver 元素定位方法总结
<input id="kw" class="s_ipt" autocomplete="off" maxlength="255" value="" name="wd"/><a class="mnav" name="test" href="http://news.baidu.com"&转载 2018-11-29 17:57:09 · 104 阅读 · 0 评论 -
Python selenium —— 一定要会用selenium的等待,三种等待方式解读
发现太多人不会用等待了,博主今天实在是忍不住要给大家讲讲等待的必要性。很多人在群里问,这个下拉框定位不到、那个弹出框定位不到…各种定位不到,其实大多数情况下就是两种问题:1 有frame,2 没有加等待。殊不知,你的代码运行速度是什么量级的,而浏览器加载渲染速度又是什么量级的,就好比闪电侠和凹凸曼约好去打怪兽,然后闪电侠打完回来之后问凹凸曼你为啥还在穿鞋没出门?凹凸曼分分中内心一万只羊驼飞过,欺...转载 2018-11-29 18:08:40 · 102 阅读 · 0 评论 -
在selenium中window.open()和click()点击链接的区别
在selenium中点击一个链接,打开一个新的页面常用的有两种方法:click和window.open()。分为两种情况:1.链接没有target="_blank"属性;当使用click点击“首页001”时的效果就是,在浏览器的当前tab直接打开“http://www.python.org/”页面。当使用window.open()点击“首页001”是的效果就是,浏览会new一个tab来打开...转载 2018-11-29 19:21:22 · 1219 阅读 · 1 评论 -
python爬取拉勾网之selenium
重点代码解释:1.调用lxml的etree实现xpath方法调用,xpath相对正则比较简单,可以不在使用Beauitfulsoup定位from lxml import etree2.界面的可视话与否,对于你的运行资源只能用减少opt=webdriver.ChromeOptions()# 把chrome设置成无界面模式,不论windows还是linux都可以,自动适配对应参数o...原创 2018-11-29 19:45:48 · 389 阅读 · 0 评论