python
文章平均质量分 51
疯狂的球球ww
这个作者很懒,什么都没留下…
展开
-
用于读取爬虫后的文件
# coding: utf-8'''Created on 2014-7-24@author: Administrator'''import urllib2from urllib2 import Requestimport reimport sysdef p(f): print '%s.%s(): %s' % (f.__module__, f.__name__, f(转载 2014-08-01 01:14:08 · 829 阅读 · 0 评论 -
python的re正则表达式
CODEC = 'UTF-8'#encoding:utf-8import rep=re.compile("ab")str = "abfffa" #match必须匹配首字母if p.match(str): print p.match(str).group() #match必须匹配首字母,group()将匹配的字母打印出来print re原创 2014-08-11 10:46:54 · 473 阅读 · 0 评论 -
python 字符串第n次出现的位置
def findSubStr01(substr, str): i=1 while i > 0: index = str.find(substr) #第一次出现的位置 index2=str.find(substr,index+1) #第二次出现的位置 index3=str.find(substr,index2+1) #第三次出现转载 2014-07-28 22:55:46 · 23326 阅读 · 0 评论 -
利用python读取文件 然后以表格的形式打印出去
##coding:utf-8 '''Created on 2014-7-28@author: Administrator'''#coding:utf-8def html_table(): html = ''' ID原创 2014-07-28 23:20:57 · 10606 阅读 · 0 评论 -
当设置代理 运行python
import urllib2#sys.setdefaultencoding('utf-8') proxy_handler = urllib2.ProxyHandler({'http' : 'http://sWX205083:@sw504248210.@openproxy.huawei.com:8080/'})opener = urllib2.build_opener(转载 2014-07-29 14:48:15 · 1633 阅读 · 0 评论 -
python 访问的时候加上头域
import urllib2from urllib2 import Request proxy_handler = urllib2.ProxyHandler({'http' : 'http://sWX205083:@sw504248210.@openproxy.huawei.com:8080/'})opener = urllib2.build_opener(proxy_han原创 2014-07-29 16:06:58 · 475 阅读 · 0 评论 -
python 总结下 字符在字符串中第n次的所在位置
def findSubStr(substr, str, i): count = 0 while i > 0: #循环来查找 index = str.find(substr) if index == -1: return -1 else: str = s转载 2014-07-29 10:59:18 · 5636 阅读 · 1 评论 -
python访问的时候,将debug信息打印出来
import urllib2httpHandler = urllib2.HTTPHandler(debuglevel=1)httpsHandler = urllib2.HTTPSHandler(debuglevel=1)opener = urllib2.build_opener(httpHandler, httpsHandler)urllib2.install_opener(opener)原创 2014-07-30 23:24:35 · 1481 阅读 · 0 评论 -
python爬虫超时的处理
#coding:utf-8'''Created on 2014-7-24@author: Administrator'''import urllib2try: url = "http://www.baidu.com" f = urllib2.urlopen(url, timeout=0) #timeout设置超时的时间 result = f.read()原创 2014-08-04 00:51:06 · 6112 阅读 · 0 评论 -
状态机实例
def main(): html = '''open source list''' status = 0 fp = open('source_list.txt', 'r') for line in fp: #将每一行的状态对应起来 if status == 0: if line.strip() == '':原创 2014-07-29 10:24:27 · 733 阅读 · 0 评论