Python
阿龙的圈子
仰望星空 脚踏实地
向前走 永不停
展开
-
Python urllib2实例代码演示
使用urllib2访问页面:import urllib2import cookieliburl = "http://www.baidu.com"print 'The first method : 'response1 = urllib2.urlopen(url)print response1.getcode()print len(response1.read())print原创 2016-05-10 10:04:54 · 5172 阅读 · 0 评论 -
Python 网页解析器BeautifulSoup示例使用
Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库.它能够通过你喜欢的转换器实现惯用的文档导航,查找,修改文档的方式.Beautiful Soup会帮你节省数小时甚至数天的工作时间。接下来,快事使用一些编程范例,使得尽快熟悉BeautifulSoup使用方法:# coding:utf8import refrom bs4 import Beau原创 2016-05-12 11:24:39 · 3727 阅读 · 0 评论 -
Python 简易网络爬虫的编写——抓取任意页面数目百度百科内容
该爬虫爬取百度百科"Python"词条有关的一千个页面爬虫架构:分为5个模块:1. 程序入口:spider_main2. url管理器:url_manager3. html下载器:html_downloader4. html解析器:html_parser5.html输出器:html_outputer所有代码打包上传,网址为:原创 2016-05-12 22:12:51 · 1669 阅读 · 0 评论 -
Python简易爬虫--抓取任意数目百度百科内容
使用Python语言,编写简单的爬虫程序,在百度百科页面上爬取跟词条“Python”有关的1000个页面(页面数目可以自己任意设定)。 这个简易的爬虫项目可以分为5个模块: 首先,需要有一个程序入口spider_main,同时作为爬虫的总控程序(调度程序), 改程序需要进行初始化: self.urls = url_manager.UrlManger()原创 2016-05-13 09:12:08 · 1050 阅读 · 0 评论 -
Python处理excel数据
Python操纵excel,控制读写原创 2016-08-23 13:02:54 · 9788 阅读 · 1 评论