Python
文章平均质量分 92
wangrengxing
这个作者很懒,什么都没留下…
展开
-
py2exe使用方法
转自:http://blog.csdn.net/suiyunonghen/article/details/4033076py2exe作者:zzj 日期:2006-07-05字体大小: 小 中 大一、简介py2exe是一个将python脚本转换成windows上的可独立执行的可执行程序(*.exe)的工具,这样,你就可以不用装python而在windows系统上运行这个可转载 2013-01-11 10:28:49 · 649 阅读 · 0 评论 -
Python 线程池扫描端口
最近在温习《python 核心编程》,看到了作者留给读者的非常简单明了的“生产者-消费者模型”,这里作简要记录:1.一个生产者随机的“生产”(添加物品到队列中)2.一个消费者随机的“消费”(从队列中取出物品)3.正如上面的描述,这个队列就是线程间的共享数据空间ps:1.由于希望消费者在消费时尽可能的有“货源”,所以他们的等待时间要稍微长一点2.由于“货物”的数量随机后就已经转载 2013-01-07 08:41:27 · 572 阅读 · 0 评论 -
python网络爬虫
#FileName: toolbox_insight.pyfrom sgmllib import SGMLParserimport threadingimport timeimport urllib2import StringIOimport gzipimport stringimport os#rewrite SGMLParser for start_aclass Baseg转载 2013-01-01 15:34:15 · 617 阅读 · 0 评论 -
Python网页抓取、模拟登录
POST参数可以使用chorm或fireforx+httpfox来获取本文主要用python实现了对网站的模拟登录。通过自己构造post数据来用Python实现登录过程。当你要模拟登录一个网站时,首先要搞清楚网站的登录处理细节(发了什么样的数据,给谁发等...)。我是通过HTTPfox来抓取http数据包来分析该网站的登录流程。同时,我们还要分析抓到的pos转载 2012-12-31 20:09:28 · 4361 阅读 · 0 评论 -
用python爬虫抓站的一些技巧总结
学用python也有3个多月了,用得最多的还是各类爬虫脚本:写过抓代理本机验证的脚本,写过在discuz论坛中自动登录自动发贴的脚本,写过自动收邮件的脚本,写过简单的验证码识别的脚本,本来想写google music的抓取脚本的,结果有了强大的gmbox,也就不用写了。这些脚本有一个共性,都是和web相关的,总要用到获取链接的一些方法,再加上simplecd这个半爬虫半网站的项目,累积不少转载 2013-01-01 15:35:18 · 702 阅读 · 0 评论 -
Python字符编码详解
本文简单介绍了各种常用的字符编码的特点,并介绍了在python2.x中如何与编码问题作战 :) 请注意本文关于Python的内容仅适用于2.x,3.x中str和unicode有翻天覆地的变化,请查阅其他相关文档。 尊重作者的劳动,转载请注明作者及原文地址 >.1. 字符编码简介1.1. ASCIIASCII(American Standard Code for转载 2013-01-02 15:20:03 · 318 阅读 · 0 评论 -
python的命名空间和作用域
name space是从名称(name)到对象(object)上的映射(map)。当一个name映射到一个object上时,我们说这个name与这个object有绑定(bind)关系,或说这个name指向这个object。每个name只对应一个object,而一个object可有多个名字(name)。(注意name不是object本身)因为类的定义借用了命名空间,所以要深入转载 2012-12-30 16:26:15 · 1025 阅读 · 0 评论 -
Python类
class abs: def abs(self): raise NotImplementedError类本身就是一个对象,具有独立命名空间。class A: count = 0 alive = 0 def __init__(self): # 创建时调用 print "this is first called"原创 2012-12-30 20:06:25 · 533 阅读 · 0 评论 -
python之yield理解
生成器的设计动机(PEP255)2.3版本加入yield关键字编程场景中有一类Producor Function,随着调用会生产一系列值。例如,在用于源码解析的tokenize模块中,分析源码时不断通过token返回片段,解决这一问题通常有以下几个方法:在全局变量中维护一个状态机用于记录目前进行到哪里,希望下一步获得什么,通过回调方法与外部互动;缺点:状态机维护转载 2013-01-14 15:36:24 · 820 阅读 · 0 评论