- 博客(10)
- 资源 (13)
- 收藏
- 关注
转载 python异常简单使用方法
1. try...except Python代码 tommy@lab3:~$ python Python 2.5.2 (r252:60911, Jan 4 2009, 17:40:26) [GCC 4.3.2] on linux2 Type "help", "copyright", "credits" or "license" for more
2012-03-26 17:23:57 1406
转载 python 去掉list中的重复元素
def f1(seq): # not order preserving set = {} map(set.__setitem__, seq, []) return set.keys() def f2(seq): # order preserving checked = [] for e in seq: if
2012-03-26 11:36:31 2511
转载 Python:文件操作技巧(File operation)
读写文件 # ! /usr/bin/python # -*- coding: utf8 -*- spath = " D:/download/baa.txt " f = open(spath, " w " ) # Opens file for writing.Creates this file doesn't exist. f.write( " First l
2012-03-24 18:45:16 1813
转载 利用Python抓取和解析网页
对搜索引擎、文件索引、文档转换、数据检索、站点备份或迁移等应用程序来说,经常用到对网页(即HTML文件)的解析处理。事实上,通过Python语言提供的各种模块,我们无需借助Web服务器或者Web浏览器就能够解析和处理HTML文档。本文将详细介绍如何利用Python抓取和解析网页。首先,我们介绍一个可以帮助简化打开位于本地和Web上的HTML文档的Python模块,然后,我们论述如何使用Python
2012-03-24 18:38:46 3215
转载 使用Python中的HTMLParser、cookielib抓取和解析网页、从HTML文档中提取链接、图像、文本、Cookies
对搜索引擎、文件索引、文档转换、数据检索、站点备份或迁移等应用程序来说,经常用到对网页(即HTML文件)的解析处理。事实上,通过 Python语言提供的各种模块,我们无需借助Web服务器或者Web浏览器就能够解析和处理HTML文档。本文上篇中,我们介绍了一个可以帮助简化打开 位于本地和Web上的HTML文档的Python模块。在本文中,我们将论述如何使用Python模块来迅速解析在HTML文件中的
2012-03-24 18:37:33 3113
转载 Python抓网页内容
用Python语言写搜索引擎蜘蛛的脚本非常简单、轻松。给大家分享两种抓网页内容的方法 一、用urllib2/sgmllib包,将目标网页的所有URL列出。 import urllib2 from sgmllib import SGMLParser class URLLister(SGMLParser): def reset(self):
2012-03-24 18:34:23 1076
转载 Python 标准库 urllib2 的使用细节
Python 标准库中有很多实用的工具类,但是在具体使用时,标准库文档上对使用细节描述的并不清楚,比如 urllib2 这个 HTTP 客户端库。这里总结了一些 urllib2 库的使用细节。 1 Proxy 的设置2 Timeout 设置3 在 HTTP Request 中加入特定的 Header4 Redirect5 Cookie6 使用 HTTP 的 PUT 和 DEL
2012-03-24 18:33:15 573
转载 python类型转换
函数 描述 int(x [,base ]) 将x转换为一个整数 long(x [,base ]) 将x转换为一个长整数 float(x ) 将x转换到一个浮点数 complex(real [,imag ]) 创建一个复数 str(x ) 将对象
2012-03-24 18:30:48 421
转载 python抓网页中文乱码问题
import urllib2 import sys content = urllib2.urlopen("http://www.higis.cn").read() #网站页面是utf-8编码的。 type = sys.getfilesystemencoding() # 关键 print content.decode("UTF-8").encode(typ
2012-03-24 15:10:28 1048
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人