- 博客(6)
- 收藏
- 关注
原创 python学习笔记——问题篇
忙于复习考试,忙中抽空写写爬虫,出了点小问题:1、网络爬虫程序不稳定,不是每一次都能抓取成功,或者爬着爬着就停住了2、有些网站不能爬取小问题,
2014-11-12 20:55:20 464 1
原创 urllib2方法介绍
1. 刷页面 urlopen 接收一个 字符串型的url 或者是 一个Request对象,并且打开这个url返回一个像文件类型的返回值import urllib2resource=urllib2.urlopen("http://www.dpuban.com") // 1. 向域名发出请求 2. 服务器响应content=resource.read()print content
2014-11-08 14:46:43 624
原创 Python标准库获取HTML资源之urllib2
我们平时通过浏览器可以从URL中获取相应的资源并展示出来,但是很多时候我们只是需要对获取的html资源进行特定的处理,就用到了python的urliib,urllib2和httplib等标准库urllib2用于编写需要和http服务器,ftp服务器和本地文件交互的客户端;典型的应用程序有:抓取网页数据,代理,web爬虫等1.使用urlopen()发生请求,获取HTTP资源urlopen
2014-11-07 17:23:12 600
原创 python spider学习笔记(一)
以前早就听说过网络爬虫这东西,如今我也开始接触这神奇的东西了,可是乍一看,都是一些高大上的东西,天书啊,什么也看不懂,不知道初学者是否有和我一样的感受?万事开头难,但是总有办法解决的。首先,我们得学一些网页基础知识,如何一步步深入。一、网络爬虫的定义网络爬虫,即Web Spider,是一个很形象的名字。网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者)
2014-11-07 15:22:03 4094
原创 python学习进程及体会
前段开始学习python这个强大的工具,在学了两周之后,最大的感觉就是:关键字少,结构简单,语法清晰。它没有其他语言通常用来访问变量、定义代码模块和进行模式匹配的命令式符号。总之就是很不错的一个工具。 上上一周我看完了《简明python教程》,大致了解了它的语法结构,但是各个模块还不是很清。在接下来的一周,我对python的String、列表和字典进行了仔细的学习,对这几块的函数方法及语法有
2014-11-01 14:27:21 561
原创 python 字符串常用函数方法整合
字符串中字符大小写的变换:S.lower() #小写S.upper() #大写S.swapcase() #大小写互换S.capitalize() #首字母大写String.capwords(S)#这是模块中的方法。它把S用split()函数分开,然后用capitalize()把首字母变成大写,最后用join()合并到一起S.title() #只有首字母大写,其余为小
2014-11-01 14:00:47 507
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人