- 博客(26)
- 资源 (29)
- 收藏
- 关注
转载 Python面试--编程题
1 台阶问题/斐波纳挈一只青蛙一次可以跳上1级台阶,也可以跳上2级。求该青蛙跳上一个n级的台阶总共有多少种跳法。Pythonfib = lambda n: n if n 1fib= lambdan:n ifn 2 elsefib(n- 1)+ fib(n- 2)
2017-03-31 18:45:25 5633
转载 使用 Python 模块 re 实现解析小工具
Python 模块 re(Regular Expression)是一个很有价值并且非常强大的文本解析工具,本文通过一个简单有趣的小实例来分享一下此模块的使用方法。首先讲述 Python re 的语法和功能,并通过实际代码片段分步描述实现文本解析小工具的过程,最后演示该小工具的效果,并且为读者提供运行在 Google App Engine 上的实例。1评论孙 翎, 软件工程师
2017-03-30 15:17:01 495
转载 Python爬虫入门(8):Beautiful Soup的用法
首页所有文章观点与动态基础知识系列教程实践项目工具与框架工具资源Python小组伯乐在线 >Python - 伯乐在线 > 所有文章 > 实践项目 > Python爬虫入门(8):Beautiful Soup的用法Python爬虫入门(8):Beautiful Soup的用法2015/04/25 · 实践项目,
2017-03-29 17:40:41 824
转载 Python爬虫入门(7):正则表达式
在前面我们已经搞定了怎样获取页面的内容,不过还差一步,这么多杂乱的代码夹杂文字我们怎样把它提取出来整理呢?下面就开始介绍一个十分强大的工具,正则表达式!1.了解正则表达式正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。正则表达式是用来匹配字符串非常强大的工具,
2017-03-29 15:22:36 372
转载 Python爬虫入门六之Cookie的使用
大家好哈,上一节我们研究了一下爬虫的异常处理问题,那么接下来我们一起来看一下Cookie的使用。为什么要使用Cookie呢?Cookie,指某些网站为了辨别用户身份、进行session跟踪而储存在用户本地终端上的数据(通常经过加密)比如说有些网站需要登录后才能访问某个页面,在登录之前,你想抓取某个页面内容是不允许的。那么我们可以利用Urllib2库保存我们登录的Cookie,然后再抓取
2017-03-29 13:37:30 440
转载 Python爬虫入门(5):URLError异常处理
大家好,本节在这里主要说的是URLError还有HTTPError,以及对它们的一些处理。1.URLError首先解释下URLError可能产生的原因:网络无连接,即本机无法上网连接不到特定的服务器服务器不存在在代码中,我们需要用try-except语句来包围并捕获相应的异常。下面是一个例子,先感受下它的风骚Pythonimport urllib2
2017-03-29 13:19:35 369
转载 Python爬虫入门(4):Urllib库的高级用法
1.设置Headers有些网站不会同意程序直接用上面的方式进行访问,如果识别有问题,那么站点根本不会响应,所以为了完全模拟浏览器的工作,我们需要设置一些Headers 的属性。首先,打开我们的浏览器,调试浏览器F12,我用的是Chrome,打开网络监听,示意如下,比如知乎,点登录之后,我们会发现登陆之后界面都变化 了,出现一个新的界面,实质上这个页面包含了许许多多的内容,这些内容也不是一次
2017-03-29 13:18:06 464
转载 Python爬虫入门三之Urllib库的基本使用
那么接下来,小伙伴们就一起和我真正迈向我们的爬虫之路吧。1.分分钟扒一个网页下来怎样扒网页呢?其实就是根据URL来获取它的网页信息,虽然我们在浏览器中看到的是一幅幅优美的画面,但是其实是由浏览器解释才呈现出来的,实质它是一段HTML代码,加 JS、CSS,如果把网页比作一个人,那么HTML便是他的骨架,JS便是他的肌肉,CSS便是它的衣服。所以最重要的部分是存在于HTML中的,下面我们就写
2017-03-29 11:14:04 392
转载 Python爬虫入门二之爬虫基础了解
1.什么是爬虫爬虫,即网络爬虫,大家可以理解为在网络上爬行的一直蜘蛛,互联网就比作一张大网,而爬虫便是在这张网上爬来爬去的蜘蛛咯,如果它遇到资源,那么它就会抓取下来。想抓取什么?这个由你来控制它咯。比如它在抓取一个网页,在这个网中他发现了一条道路,其实就是指向网页的超链接,那么它就可以爬到另一张网上来获取数据。这样,整个连在一起的大网对这之蜘蛛来说触手可及,分分钟爬下来不是事儿。2.浏
2017-03-29 10:55:49 358
转载 Python爬虫入门一之综述
大家好哈,最近博主在学习Python,学习期间也遇到一些问题,获得了一些经验,在此将自己的学习系统地整理下来,如果大家有兴趣学习爬虫的话,可以将这些文章作为参考,也欢迎大家一共分享学习经验。Python版本:2.7,Python 3请另寻其他博文。首先爬虫是什么?网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动的抓取万
2017-03-29 10:52:34 408
转载 Python语言特性-面试题
1 Python的函数参数传递看两个例子:Pythona = 1def fun(a): a = 2fun(a)print a # 112345a= 1def fun(a): a= 2fun(a)printa # 1
2017-03-28 17:02:50 1211
转载 Python-copy()与deepcopy()区别
版权声明:本文为博主原创文章,欢迎随时转载,转载时请务必注明出处,同时欢迎广大朋友指点评论。最近在实习,boss给布置了一个Python的小任务,学习过程中发现copy()和deepcopy()这对好基友实在是有点过分,搞的博主就有点傻傻分不清啊,但是呢本着一探到底的精神,还是要查资料搞清楚这对好基友的区别。其实呢,copy()与deepcopy()之间的区分必须要涉及到pytho
2017-03-28 16:56:05 467
转载 零基础自学用Python 3开发网络爬虫(五): 使用第三方模块快速抓取与解析
点击进入本系列目录在前面的四篇文章中, 我们一直采用 python 3 自带的 urllib 模块来抓取网页, 然后用 re 模块来处理抓取到的数据. 这次我们使用 Requests 库来代替 urllib, 用 BeautifulSoup 来代替 re 模块.对于这两个模块来说, 学习使用它们的最好方法是看官方文档, 这两个模块的官方文档都有中文版(翻译的不是很完整).Requ
2017-03-28 15:27:18 1725
转载 零基础自学用Python 3开发网络爬虫(四): 登录
点击进入本系列目录今天的工作很有意思, 我们用 Python 来登录网站, 用Cookies记录登录信息, 然后就可以抓取登录之后才能看到的信息. 今天我们拿知乎网来做示范. 为什么是知乎? 这个很难解释, 但是肯定的是知乎这么大这么成功的网站完全不用我来帮他打广告. 知乎网的登录比较简单, 传输的时候没有对用户名和密码加密, 却又不失代表性, 有一个必须从主页跳转登录的过程.不得不说
2017-03-28 14:45:05 983
转载 零基础自学用Python 3开发网络爬虫(三): 伪装浏览器君
点击进入本系列目录上一次我自学爬虫的时候, 写了一个简陋的勉强能运行的爬虫alpha. alpha版有很多问题. 比如一个网站上不了, 爬虫却一直在等待连接返回response, 不知道超时跳过; 或者有的网站专门拦截爬虫程序, 我们的爬虫也不会伪装自己成为浏览器正规部队; 并且抓取的内容没有保存到本地, 没有什么作用. 这次我们一个个解决这些小问题.此外, 在我写这系列文章的第二篇的时候
2017-03-28 13:27:11 600
转载 零基础自学用Python 3开发网络爬虫(二): 用到的数据结构简介以及爬虫Ver1.0 alpha
点击进入本系列目录上一回, 我学会了用伪代码写出爬虫的主要框架;用Python的urllib.request库抓取指定url的页面;用Python的urllib.parse库对普通字符串转符合url的字符串.这一回, 开始用Python将伪代码中的所有部分实现. 由于文章的标题就是"零基础", 因此会先把用到的两种数据结构队列和集合介绍一下. 而对于"正则表达式"部分, 限于篇幅不
2017-03-28 10:59:24 864
转载 零基础自学用Python 3开发网络爬虫(一)
点击进入本系列目录由于本学期好多神都选了Cisco网络课, 而我这等弱渣没选, 去蹭了一节发现讲的内容虽然我不懂但是还是无爱. 我想既然都本科就出来工作还是按照自己爱好来点技能吧, 于是我就不去了. 一个人在宿舍没有点计划好的事情做就会很容易虚度, 正好这个学期主打网络与数据库开发, 那就先学学Python开发爬虫吧. 我失散多年的好朋友Jay Loong突然说他会爬虫了, 我感到真棒, 我也
2017-03-28 10:58:14 727
转载 python 里面的单下划线与双下划线的区别
Python 用下划线作为变量前缀和后缀指定特殊变量。_xxx 不能用'from moduleimport *'导入 __xxx__ 系统定义名字 __xxx 类中的私有变量名 核心风格:避免用下划线作为变量名的开始。因为下划线对解释器有特殊的意义,而且是内建标识符所使用的符号,我们建议程序员避免用下划线作为变量名的开始。一般来讲,变量名_xxx被看作是“私有
2017-03-24 16:26:54 3363
转载 python中@classmethod @staticmethod区别
Python中3种方式定义类方法, 实例方式, @classmethod修饰方式, @staticmethod修饰方式.class A(object): def foo(self, x): print("executing foo(%s,%s)" % (self, x)) print('self:', self) @classmethod
2017-03-24 10:28:39 629
转载 Python设计模式——装饰模式(Decorator)
假如我们需要开发一个程序来展示一个人穿衣服的过程。#encoding=utf-8__author__ = 'kevinlu1010@qq.com'class Person(): def __init__(self,name): print '%s开始穿衣'%name def wear_tshirt(self): print '穿TSh
2017-03-23 18:41:36 440
转载 Python Json序列化与反序列化
在python中,序列化可以理解为:把python的对象编码转换为json格式的字符串,反序列化可以理解为:把json格式字符串解码为python数据对象。在python的标准库中,专门提供了json库与pickle库来处理这部分。 json的dumps方法和loads方法,可实现数据的序列化和反序列化。具体来说,dumps方法,可将json格式数据序列为Python的相关的数据类型;loa
2017-03-23 17:26:06 813
转载 浅析python 中__name__ = '__main__' 的作用
这篇文章主要介绍了python 中__name__ = '__main__' 的作用,对于初学者来说很有帮助,需要的朋友可以参考下很多新手刚开始学习python的时候经常会看到python 中__name__ = \'__main__\' 这样的代码,可能很多新手一开始学习的时候都比较疑惑,python 中__name__ = '__main__' 的作用,到底干嘛的?有句话经典的
2017-03-23 11:31:39 304
转载 Python基本运算符
什么是操作符?简单的回答可以使用表达式4 + 5等于9,在这里4和5被称为操作数,+被称为操符。 Python语言支持操作者有以下几种类型。算术运算符比较(即关系)运算符赋值运算符逻辑运算符位运算符会员操作符标识操作符让我们逐一看看所有的运算符。Python算术运算符:假设变量a持有10和变量b持有20,则:[ 查
2017-03-23 11:09:30 688
原创 正则表达式全部符号解释
[\s\S]* 包括\n在内的所有字符字符 描述 \ 将下一个字符标记为一个特殊字符、或一个原义字符、或一个 向后引用、或一个八进制转义符。例如,'n' 匹配字符 "n"。'\n' 匹配一个换行符。序列 '\\' 匹配 "\" 而 "\(" 则匹配 "("。 ^ 匹配输入字符串的开始位置。如果设置了 RegExp 对象的 Multiline 属性,^ ...
2017-03-22 21:39:52 636
转载 python实现简单爬虫功能
在我们日常上网浏览网页的时候,经常会看到一些好看的图片,我们就希望把这些图片保存下载,或者用户用来做桌面壁纸,或者用来做设计的素材。 我们最常规的做法就是通过鼠标右键,选择另存为。但有些图片鼠标右键的时候并没有另存为选项,还有办法就通过就是通过截图工具截取下来,但这样就降低图片的清晰度。好吧~!其实你很厉害的,右键查看页面源代码。 我们可以通过python 来实现这样一个简单的爬虫功能
2017-03-22 21:23:26 384
转载 Python面试必须要看的15个问题
本文由EarlGrey@编程派独家编译,转载请务必注明作者及出处。 原文:Sheena@codementor 译文:编程派引言想找一份Python开发工作吗?那你很可能得证明自己知道如何使用Python。下面这些问题涉及了与Python相关的许多技能,问题的关注点主要是语言本身,不是某个特定的包或模块。每一个问题都可以扩充为一个教程,如果可能的话。某些问题甚至会涉及多个领域。
2017-03-22 21:02:13 2282
Android Power On Off
2012-07-08
homeswitcher
2012-06-20
HeadFirstDesignPatterns_code
2012-06-17
android设置主题和自定义主题的方法
2012-04-20
Android实例2
2012-03-27
Android实例
2012-03-27
Android 9patch失效
2012-02-22
google_sdk_android3
2012-02-02
Google_android_java
2012-02-02
格式工厂-支持几乎所有类型多媒体格式到常用的几种格式
2012-01-26
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人