deepexpert_liujian-CSDN博客

原创 python学习笔记——问题篇

忙于复习考试，忙中抽空写写爬虫，出了点小问题：1、网络爬虫程序不稳定，不是每一次都能抓取成功，或者爬着爬着就停住了2、有些网站不能爬取小问题，

2014-11-12 20:55:20 464 1

原创 urllib2方法介绍

1. 刷页面 urlopen 接收一个字符串型的url 或者是一个Request对象，并且打开这个url返回一个像文件类型的返回值import urllib2resource=urllib2.urlopen("http://www.dpuban.com") // 1. 向域名发出请求 2. 服务器响应content=resource.read()print content

2014-11-08 14:46:43 624

原创 Python标准库获取HTML资源之urllib2

我们平时通过浏览器可以从URL中获取相应的资源并展示出来，但是很多时候我们只是需要对获取的html资源进行特定的处理，就用到了python的urliib，urllib2和httplib等标准库urllib2用于编写需要和http服务器,ftp服务器和本地文件交互的客户端;典型的应用程序有：抓取网页数据，代理，web爬虫等1.使用urlopen()发生请求，获取HTTP资源urlopen

2014-11-07 17:23:12 600

原创 python spider学习笔记（一）

以前早就听说过网络爬虫这东西，如今我也开始接触这神奇的东西了，可是乍一看，都是一些高大上的东西，天书啊，什么也看不懂，不知道初学者是否有和我一样的感受？万事开头难，但是总有办法解决的。首先，我们得学一些网页基础知识，如何一步步深入。一、网络爬虫的定义网络爬虫，即Web Spider，是一个很形象的名字。网络爬虫（又被称为网页蜘蛛，网络机器人，在FOAF社区中间，更经常的称为网页追逐者）

2014-11-07 15:22:03 4094

原创 python学习进程及体会

前段开始学习python这个强大的工具，在学了两周之后，最大的感觉就是：关键字少，结构简单，语法清晰。它没有其他语言通常用来访问变量、定义代码模块和进行模式匹配的命令式符号。总之就是很不错的一个工具。上上一周我看完了《简明python教程》，大致了解了它的语法结构，但是各个模块还不是很清。在接下来的一周，我对python的String、列表和字典进行了仔细的学习，对这几块的函数方法及语法有

2014-11-01 14:27:21 561

原创 python 字符串常用函数方法整合

字符串中字符大小写的变换：S.lower() #小写S.upper() #大写S.swapcase() #大小写互换S.capitalize() #首字母大写String.capwords(S)#这是模块中的方法。它把S用split()函数分开，然后用capitalize()把首字母变成大写，最后用join()合并到一起S.title() #只有首字母大写，其余为小

2014-11-01 14:00:47 507

deepexpert_liujian的专栏