Python-模块
文章平均质量分 54
wangkjs
这个作者很懒,什么都没留下…
展开
-
Python3 urllib抓取指定URL的内容
Python爬虫主要使用的是urllib模块,Python2.x版本是urllib2,很多博客里面的示例都是使用urllib2的,因为我使用的是Python3.3.2,所以在文档里面没有urllib2这个模块,import的时候会报错,找不到该模块,应该是已经将他们整合在一起了。下面是一个简单的代码示例:[python] view plaincopy转载 2015-08-12 12:06:04 · 627 阅读 · 0 评论 -
Python2.x urllib2
Python 标准库中有很多实用的工具类,但是在具体使用时,标准库文档上对使用细节描述的并不清楚,比如 urllib2 这个 HTTP 客户端库。这里总结了一些 urllib2 的使用细节。Proxy 的设置Timeout 设置在 HTTP Request 中加入特定的 HeaderRedirectCookie使用 HTTP 的 PUT 和 DELETE 方法转载 2015-08-12 14:17:55 · 515 阅读 · 0 评论 -
python urllib/urllib2 get/post使用详解
1、urllib2可以接受一个Request类的实例来设置URL请求的headers,urllib仅可以接受URL。这意味着,你不可以伪装你的User Agent字符串等。2、urllib提供urlencode方法用来GET查询字符串的产生,而urllib2没有。这是为何urllib常和urllib2一起使用的原因。urllib get数据的方法 (params是关键字)#!/usr/转载 2015-08-12 14:51:54 · 31011 阅读 · 0 评论 -
日志 logging
import logging import oslogging.basicConfig(filename = os.path.join(os.getcwd(), 'log.txt'), level = logging.DEBUG) logging.debug('debug message') logging.info('info message') logging转载 2015-08-12 11:00:19 · 424 阅读 · 0 评论 -
Python3.X 下载图片
urlretrieve(url, filename=None, reporthook=None, data=None) urlretrieve方法直接将远程数据下载到本地。参数filename指定了保存到本地的路径(如果未指定该参数,urllib会生成一个临时文件来保存数据);参数reporthook是一个回调函数,当连接上服务器.以及相应的数据块传输完毕的时候会触发该回调.py转载 2015-08-12 12:36:15 · 3544 阅读 · 0 评论 -
Python2.x urllib
Python urllib模块urlopen()与urlretrieve()的使用方法详解。1.urlopen()方法urllib.urlopen(url[, data[, proxies]]) :创建一个表示远程url的类文件对象,然后像本地文件一样操作这个类文件对象来获取远程数据。参数url表示远程数据的路径,一般是网址;参数data表示以post方式提交到url的数据(玩过w转载 2015-08-12 14:09:47 · 377 阅读 · 0 评论 -
os模块
一、os模块概述Python os模块包含普遍的操作系统功能。如果你希望你的程序能够与平台无关的话,这个模块是尤为重要的。(一语中的)二、常用方法1、os.name输出字符串指示正在使用的平台。如果是window 则用'nt'表示,对于Linux/Unix用户,它是'posix'。2、os.getcwd()函数得到当前工作目录,即当前Python脚本转载 2015-08-12 10:38:35 · 307 阅读 · 0 评论 -
Python 加密 md5
python3.x已经把md5 module移除了。1import hashlib2m = hashlib.md5()3m.update(b"Nobody inspects the spammish repetition") #参数必须是byte类型,否则报Unicode-objects must be encoded before hashing错误4转载 2015-08-11 15:00:28 · 985 阅读 · 0 评论 -
Python3.x urllib
Python3.X3.0版本中已经将urllib2、urlparse、和robotparser并入了urllib中,并且修改urllib模块,其中包含5个子模块,即是help()中看到的那五个名字。help(urllib)2.x版本的python可以直接使用import urllib来进行操作,但是3.x版本的python使用的是import urllib.reques转载 2015-08-12 11:56:59 · 1219 阅读 · 0 评论