Python
Mr_Tank_
这个作者很懒,什么都没留下…
展开
-
Python3 urllib抓取指定URL的内容
最近在研究Python,熟悉了一些基本语法和模块的使用;现在打算研究一下Python爬虫。学习主要是通过别人的博客和自己下载的一下文档进行的,自己也写一下博客作为记录学习自己过程吧。Python代码写起来和Java的感觉很不一样。Python爬虫主要使用的是urllib模块,Python2.x版本是urllib2,很多博客里面的示例都是使用urllib2的,因为我使用的是Python3.3.2原创 2013-11-03 11:16:50 · 39199 阅读 · 4 评论 -
Python3 urllib GET方式获取数据
GET方式示例【百度搜索】#encoding:UTF-8import urllibimport urllib.request#数据字典data={}data['word']='python3'#注意Python2.x的区别url_values=urllib.parse.urlencode(data)print(url_values)url="http://www.原创 2013-11-03 13:04:26 · 11017 阅读 · 0 评论 -
Python3 pickle序列化
1、什么东西能用pickle模块存储?所有Python支持的 原生类型 : 布尔, 整数, 浮点数, 复数, 字符串, bytes(字节串)对象, 字节数组, 以及 None.由任何原生类型组成的列表,元组,字典和集合。由任何原生类型组成的列表,元组,字典和集合组成的列表,元组,字典和集合(可以一直嵌套下去,直至Python支持的最大递归层数).函数,类,和类的实例(带警告)。原创 2013-11-06 11:21:21 · 6032 阅读 · 0 评论 -
Python3 自定义迭代器
1、迭代器基于下面两个个方法:(1)__next__ 返回容器的下一个项目(2)__iter__ 返回迭代器本身2、当序列遍历完时,将抛出StopIteration异常,所以通过捕获这个异常来停止循环下面是自定义迭代器的示例代码:#encoding:UTF-8class MyIterator(object): def __init__(self,step):原创 2013-11-21 23:18:53 · 3786 阅读 · 0 评论 -
Python3 win7安装BeautifulSoup
BeautifulSoup中文文档:http://www.crummy.com/software/BeautifulSoup/bs3/documentation.zh.htmlBeautifulSoup下载:http://www.crummy.com/software/BeautifulSoup/解压到Python目录运行cmd执行:python setup.py install即原创 2013-12-15 13:36:31 · 13994 阅读 · 0 评论 -
Python3 BeautifulSoup4结合urllib简单使用
1、使用urllib下载网页2、构造BeautifulSoup对象3、剖析文档代码示例:【需要注意import模块版本的区别】import urllib.requestfrom bs4 import BeautifulSoupimport redef getgxnu(): url="http://www.gxnu.edu.cn/default.html" d原创 2013-12-15 15:00:17 · 12422 阅读 · 0 评论 -
Python3 yield使用
yield 的作用就是把一个函数变成一个 generator,带有 yield 的函数不再是一个普通函数,Python 解释器会将其视为一个 generator简单示例:#encoding:UTF-8def yield_test(n): for i in range(n): yield call(i) print("i=",i) #做一些其原创 2013-12-16 21:57:17 · 10873 阅读 · 0 评论