- 博客(15)
- 收藏
- 关注
原创 selenium中接受alert
selenium中提示错误: selenium.common.exceptions.WebDriverException: Message: unknown error: Element <a href="#" class="prefpanelgo">...</a> is not clickable at point (580, 207). Other eleme...
2018-10-23 20:48:39 2800 3
原创 通过currUrl 判断登录163邮箱是否成功---Python
# coding:utf-8'''4.1.1 id定位 find_element_by_id('kw') find_element_by_id('su') find_element_by_id()方法通过id属性来定位元素4.1.2 name定位 find_element_by_name('wd')4.1.3 class定位 find_element_by_class_...
2018-10-22 18:32:23 1150
翻译 selenium - 元素交互操作,对于获取的元素调用交互方法
# coding:utf-8from selenium import webdriverimport timefrom selenium.webdriver.common.keys import Keysbrowser = webdriver.Chrome()browser.get("http://baidu.com")# lis = browser.find_elements_b...
2018-10-15 14:36:48 1957
翻译 python 之 列表 元组 字典之间的转换
# coding:utf-8# 1 字典dict = {'name': 'A', 'age': 24, 'class': 'First'} # 1.1 转换为字符串,返回<type 'str'>{'age': 7, ...}print type(str(dict)), str(dict) # 转为元组print tuple(dict) # 字典转为元组返回,(7, A,...
2018-09-06 10:13:07 5986
原创 Python爬虫开发-08--遇到了好多困难 头都大了 终于搞好了
# coding:utf-8from lxml import etreeimport ioimport sys import timereload(sys) sys.setdefaultencoding('utf-8')from bs4 import BeautifulSoup# from lxml import etreeimport requestsimport re# ...
2018-05-12 23:46:35 498
原创 Python爬虫开发-07--正则表达式-unexpected end of pattern-闹鬼!
# coding: utf-8import re# 注意P要从大写 要不然会出现错误:unexpected end of patternP = re.compile(r'(?P<word1>\w+) (?P<word2>\w+)') s = 'i say, hello world!'print P.sub(r'\g<word2> \g<word1...
2018-05-12 17:18:43 794
原创 Python爬虫开发-06--设置时间延迟
# encoding: utf-8import urllibimport urllib2import socket# 设置超时# 10s 后超时# socket.setdefaulttimeout(10)# 这是另一种方式# urllib2.socket.setdefaulttimeout(10)# ____________________________________...
2018-05-11 22:52:13 13194
原创 Python爬虫开发-05--自己添加Cookie
# encoding:utf-8'''续-04:有时候,我们不需要urllib2自动处理,想自己添加Cookie的内容,可以通过设置请求头是的Cookie域来做。'''import urllib2opener = urllib2.build_opener()'''复习一下append()的用法以及它与extend()的区别:append()方法是指在列表末尾增加一个数据项;e...
2018-05-11 22:40:22 1259
原创 Python爬虫开发-04--创建一个容器存放Cookie
# encoding: utf-8import urllibimport urllib2import cookielib'''许多网站资源获取需要用户登录,登录后再次访问就不需要再次输入账号密码等信息了。那么这个功能网站是如何实现的呢? 一般的,用户登录之后,服务器会为该用户创建一个Session,Session相当于用户的私人档案,也可以等同于用户;那么到底哪一次访问时输入该用...
2018-05-11 22:18:12 347
原创 Python爬虫开发-03--使用headers爬取网页的简单模型
# encoding:utf-8import urllibimport urllib2# 请求url = 'https://www.zhihu.com/#signin'''' 但是有时候服务器会检查请求头,判断是否来自浏览器的访问,这是反爬虫的常用手段 这时候需要对程序作出修改——增添请求头信息''' # 加上请求头信息,设置请求头中的User-Agent域和Referer域信...
2018-05-11 21:44:17 808
原创 Python爬虫开发-02--POST请求的爬虫模型
与GET方式的区别在于:增加了请求数据。import urllibimport urllib2url = 'http://www.zhihu.com/signup?next=%2F'postdata = {'username ': 'qiye', 'password': 'qiyepass'}data = urllib.urlencode(postdata)req = urlli...
2018-05-11 13:59:11 338
原创 Python爬虫开发-01--最简单的一个爬虫模型
目的:实现一个完成的请求与响应模型 urllib2提供一个基础函数URLopen,通过指定的URL发出请求来获取数据,最简单的形式就是:import urllib2# 请求打开某页面response = urllib2.urlopen("http://www.zhihu.com")# 读取页面内容并将之赋值给htmlhtml = response.read()# 打印html页面内...
2018-05-11 13:43:22 1207
原创 求企业利润,简化版
def money(y): if y <= 100000: count = y * 0.1 return count elif y > 100000 and y <= 200000: count = 10000 * 0.1 + (y - 100000) * 0.075 return count elif y > 200000 and y < 40...
2018-05-10 13:52:52 199
原创 有1/2/3/4 四个数字,能组成多少个互不相同的三位数?都是多少?
解题思路:排列组合式的数字组合,设X = [1, 4],Y = [1, 4],Z = [1, 4],XYZ = []。重点是,XYZ在组合的时候互不相等。基于Python 2方法一:for x in range(1, 5): for y in range(1, 5): for z in range(1, 5): if x != y and y != z...
2018-05-10 13:31:59 4418
原创 TCP的三次握手和四次挥手
TCP实现可靠的传输,是靠seq确认完成的。TCP传送数据,既要保证数据的可靠传输,还要保证数据的传输效率,而用三次握手恰恰能够满足可靠和效率的需求。第一次握手:Client端向Server端发送请求报文段;意思是,我要向你发送数据了,问Server端是否可以收到呢?第二次握手:Server端收到Client端连接请求报文段后,若同意连接,则发送一个应答;意思是,好的,我答应你
2017-11-29 14:25:56 190
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人