- 博客(8)
- 资源 (1)
- 收藏
- 关注
转载 正则表达式的特殊字符
正则表达式的特殊字符 符号 说明 ^ 正则表达式的开始字符 $ 正则表达式的结束字符 \w 匹配字母、数字、下划线 \W 匹配不是字符、数字、下划线的字符 \s 匹配空白字符 \S 匹配不是空白的字符 \d 匹配数字 \D 匹配非数字的字符
2017-11-03 17:44:24 2293
转载 encode和decode
字符串在Python内部的表示是unicode编码. 在做编码转换时,通常需要以unicode作为中间编码,即先将其他编码的字符串解码(decode)成unicode,再unicode编码(encode)成另一种编码。 decode的作用是将其他编码的字符串转换成unicode编码, 如str1.decode('gb2312'),表示将gb2312编码的字符串转换成unicod
2017-11-03 17:25:18 389
转载 [python] 转义符、格式化字符串的替代符
http://xukaizijian.blog.163.com/blog/static/170433119201111114255393/
2017-11-03 17:03:13 1162
转载 re模块中match对象的方法和属性
属性和方法 说 明 Pos 搜索的开始位置 Endpos 搜索的结束位置 String 搜索的字符串 Re 当前使用的正则表达式的对象 Lastindex 最后匹配的组索引 Lastgroup 最后匹配的组名 group(index=0) 某个分组的匹配结果。如果index等
2017-11-03 11:41:14 2417
转载 cookielib模块基础学习
# -*- coding: utf-8 -*-# python:2.x__author__ = 'Administrator'import cookielib#主要用于处理http客户端的cookie #cookielib.loadError在一个异常文件中失败加载,是IOEerror的子类#cookielib.CookieJar用于存储cookie对象,此模块
2017-11-01 16:40:59 444
转载 cookielib的使用
为什么要获取cookie直接写这段代码就可以:#获取一个保存cookie的对象 cj = cookielib.LWPCookieJar()#将一个保存cookie对象,和一个HTTP的cookie的处理器绑定 cookie_support = urllib2.HTTPCookieProcessor(cj) #创建一个opener,将保存了cookie的http处理器,还
2017-11-01 16:33:51 1450
转载 cookielib 模块基本运用
cookielib 模块提供了可储存 cookie 的对象。捕获cookie后并在后续连接请求的重新发送。处理包含 cookie 的文件1. CookieJar:储存在内存中import urllib2import cookirlibcookie = cookielib.CookieJar()handler = urllib2.HTTPCookieProcessor(cooki
2017-11-01 16:26:11 990
转载 零基础写python爬虫之urllib2中的两个重要概念:Openers和Handlers
在开始后面的内容之前,先来解释一下urllib2中的两个个方法:info / geturl urlopen返回的应答对象response(或者HTTPError实例)有两个很有用的方法info()和geturl()1.geturl():这个返回获取的真实的URL,这个很有用,因为urlopen(或者opener对象使用的)或许会有重定向。获取的URL或许跟请求URL不同
2017-11-01 14:36:29 358
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人