自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

deepexpert_liujian的专栏

坚信一句话:没有人会让你输,除非你不想赢!

  • 博客(6)
  • 收藏
  • 关注

原创 python学习笔记——问题篇

忙于复习考试,忙中抽空写写爬虫,出了点小问题:1、网络爬虫程序不稳定,不是每一次都能抓取成功,或者爬着爬着就停住了2、有些网站不能爬取小问题,

2014-11-12 20:55:20 422 1

原创 urllib2方法介绍

1. 刷页面 urlopen 接收一个 字符串型的url 或者是 一个Request对象,并且打开这个url返回一个像文件类型的返回值import urllib2resource=urllib2.urlopen("http://www.dpuban.com") // 1. 向域名发出请求 2. 服务器响应content=resource.read()print content

2014-11-08 14:46:43 616

原创 Python标准库获取HTML资源之urllib2

我们平时通过浏览器可以从URL中获取相应的资源并展示出来,但是很多时候我们只是需要对获取的html资源进行特定的处理,就用到了python的urliib,urllib2和httplib等标准库urllib2用于编写需要和http服务器,ftp服务器和本地文件交互的客户端;典型的应用程序有:抓取网页数据,代理,web爬虫等1.使用urlopen()发生请求,获取HTTP资源urlopen

2014-11-07 17:23:12 594

原创 python spider学习笔记(一)

以前早就听说过网络爬虫这东西,如今我也开始接触这神奇的东西了,可是乍一看,都是一些高大上的东西,天书啊,什么也看不懂,不知道初学者是否有和我一样的感受?万事开头难,但是总有办法解决的。首先,我们得学一些网页基础知识,如何一步步深入。一、网络爬虫的定义网络爬虫,即Web Spider,是一个很形象的名字。网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者)

2014-11-07 15:22:03 4060

原创 python学习进程及体会

前段开始学习python这个强大的工具,在学了两周之后,最大的感觉就是:关键字少,结构简单,语法清晰。它没有其他语言通常用来访问变量、定义代码模块和进行模式匹配的命令式符号。总之就是很不错的一个工具。  上上一周我看完了《简明python教程》,大致了解了它的语法结构,但是各个模块还不是很清。在接下来的一周,我对python的String、列表和字典进行了仔细的学习,对这几块的函数方法及语法有

2014-11-01 14:27:21 529

原创 python 字符串常用函数方法整合

字符串中字符大小写的变换:S.lower() #小写S.upper() #大写S.swapcase() #大小写互换S.capitalize() #首字母大写String.capwords(S)#这是模块中的方法。它把S用split()函数分开,然后用capitalize()把首字母变成大写,最后用join()合并到一起S.title() #只有首字母大写,其余为小

2014-11-01 14:00:47 498

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除