- 博客(31)
- 资源 (5)
- 收藏
- 关注
原创 [python]多线程xpath爬虫
用到的知识点:XPath字符串转字典函数 eval() 注:如果含‘null、false、not、no‘之类的词: NameError: name ‘null’ is not defined。有人说:ast.literal_eval去取代eval,即可。写的很好,我没试过,只是用replace()简单地把null之类的词给做了一下替换。 -编码问题: -[bug]UnicodeDec
2016-03-29 20:37:38 1552
转载 [html]  |"|&|<|>等html字符转义
本文地址:http://write.blog.csdn.net/postedit/8817826by wusuopubupt提示:请直接按CTRL+F搜索您要查找的转义字符。常用表:No.文字表記10進表記16進表記文字 Comment001"
2016-03-29 15:30:52 4080
转载 [python]用eval强制将字符串转换为字典变量时候出错:NameError: name 'null' is not defined[python]用eval函数 字符串转dict
---------------------------------搬家声明--------------------------------------本博客已搬家至个人网站 在路上 - On the way 下面的 技术 分类。你可以通过点击 更新帖子 【已解决】Python中,用eval强制将字符串转换为字典变量时候出错:NameError: name 'null' is
2016-03-29 15:25:09 9453 1
原创 [python]爬极客网课程
# -*-encoding:utf8-*-import reimport requestsimport sysreload(sys)sys.setdefaultencoding('utf8')class pawler: ITEM_PATTERN = '(.*?)' TITLE_PATTERN = 'class="lesson-info-h2">.*?>(.*?)'
2016-03-28 15:17:28 686
转载 [python]<BUG>解决UnicodeDecodeError: ‘ascii’ codec can’t decode byte 0xe5 in position 108: ordinal not
今天做网页到了测试和数据库交互的地方,其中HTML和数据库都是设置成utf-8格式编码,插入到数据库中是正确的,但是当读取出来的时候就会出错,原因就是python的str默认是ascii编码,和unicode编码冲突,就会报这个标题错误。那么该怎样解决呢?通过搜集网上的资料,自己多次尝试,问题算是解决了,在代码中加上如下几句即可。import sysreload(sys)sys
2016-03-28 10:46:30 4045
转载 [python]遍历字典dict的几种方法
脚本:#!/usr/bin/python dict={"a":"apple","b":"banana","o":"orange"} print "##########dict######################" for i in dict: print "dict[%s]=" % i,dict[i] print "###########items#########
2016-03-28 10:44:02 69858 2
转载 [python]条件运算符 x = 条件 and a or b
现在大部分高级语言都支持“?”这个三元运算符(ternary operator),它对应的表达式如下:condition ? value if true : value if false。很奇怪的是,这么常用的运算符python居然不支持!诚然,我们可以通过if-else语句表达,但是本来一行代码可以完成的非要多行,明显不够简洁。没关系,在python里其实还是有对应的表达方式的。
2016-03-28 10:42:02 9434
转载 [python]“静态”变量:谈类属性和实例属性
本文环境:Python 2.7 一个类的三个对象实例的属性被同时修改有段代码如下:class task_queue: queue=[] def append(self,obj): self.queue.append(obj) def print_queue(self): p
2016-03-27 12:47:34 2523
转载 [python]python学习线路
语言规范:http://zh-google-styleguide.readthedocs.org/en/latest/google-python-styleguide/python_language_rules/HeadFirst Python廖雪峰python教程 http://www.liaoxuefeng.com/wiki/001374738125095c955c1e6d8bb49
2016-03-27 12:40:58 977
转载 [python]解读python内存管理机制
解读Python内存管理机制2010-07-23 09:34 Robert Chen 网络转载 字号:T | T内存管理,对于Python这样的动态语言,是至关重要的一部分,它在很大程度上甚至决定了Python的执行效率,因为在Python的运行中,会创建和销毁大量的对象,这些都涉及到内存的管理。AD:51CTO首届中国APP创新评选大赛正在招募>>
2016-03-26 19:11:19 460
转载 python面试题
注:本文的原文是 5 Great Python Interview Questions,同时谢谢 @非乌龟 指出我的疏漏,没有来源标记,也赞其细心,希望看文章的同时大家都能看下原文,因为每个人的理解不一致,原汁原味的最有帮助,我翻译很多文章的目的一是为了自己以后找资料方便;二是作为一个索引,以后再看原文的时候,能更加快捷。其目的还是希望大家能看原文的。问题一:以下的代码的输出将是什
2016-03-26 15:12:24 489
转载 [linux]npm
NPM小结nodejs的出现,可以算是前端里程碑式的一个事件,它让前端攻城狮们摆脱了浏览器的束缚,踏上了一个更加宽广的舞台。前端的可能性,从此更加具有想象空间。随着一系列基于nodes的应用/工具的出现,工作中与nodejs打交道的机会越来越多。无论在node应用的开发,还是使用中,包管理都扮演着一个很重要的作用。NPM(node package manager),
2016-03-25 18:33:53 759
转载 [python]python的包管理工具:pip和easy_install
easy_insall的作用和perl中的cpan, ruby中的gem类似,都提供了在线一键安装模块的傻瓜方便方式;而pip是easy_install的改进版, 提供更好的提示信息,删除package等功能。老版本的python中只有easy_install, 没有pip。
2016-03-25 18:20:17 376
转载 [Mac]环境变量配置
环境变量修改后,重启生效!环境变量修改后,重启生效!环境变量修改后,重启生效!mac 一般使用bash作为默认shellMac系统的环境变量,加载顺序为:/etc/profile /etc/paths ~/.bash_profile ~/.bash_login ~/.profile ~/.bashrc当然/etc/profile和/etc/paths是系统级别的,系统启动就
2016-03-25 16:35:35 274
转载 [Mac]Homebrew — OS X 的套件管理員
Homebrew — OS X 的套件管理員Homebrew,OS X 下的套件管理員。安裝的套件會放在 /usr/local 下,不會污染系統環境。另有 homebrew-cask,基於 Homebrew 的 Mac App 管理工具。官网http://brew.sh/安裝 Homebrewruby -e "$(curl -fsSL https:/
2016-03-25 16:23:20 311
转载 vim中方向键无法正常使用解决
vim中方向键无法正常使用解决 vim中方向键无法正常使用解决vim的插入模式,方向键无法使用,而是输入占据一行的ABCD字母。 可以新建一个文件.vimrc。在里面输入set uncompatible即可。 .vimrc是一个配置文件,每次启动vim都会加载这个文件。所以可以保存常用的配置到这个文件里面。
2016-03-25 12:00:56 7375
转载 [linux]ln命令
ln是linux中又一个非常重要命令,它的功能是为某一个文件在另外一个位置建立一个同不的链接,这个命令最常用的参数是-s,具体用法是:ln –s 源文件 目标文件。 当我们需要在不同的目录,用到相同的文件时,我们不需要在每一个需要的目录下都放一个必须相同的文件,我们只要在某个固定的目录,放上该文件,然后在 其它的目录下用ln命令链接(link)它就可以,不必重复的占用磁盘空间。例如:ln –
2016-03-22 16:28:14 289
转载 error: Setup script exited with error: command 'x86_64-linux-gnu-gcc' failed with exit status 1
sudo apt-get install build-essential autoconf libtool pkg-config python-opengl python-imaging python-pyrex python-pyside.qtopengl idle-python2.7 qt4-dev-tools qt4-designer libqtgui4 libqtcore4 libqt4-
2016-03-21 20:09:01 1609
转载 Vim 的 Python 编辑器详细配置过程 (Based on Ubuntu 12.04 LTS)
Vim 的 Python 编辑器详细配置过程 (Based on Ubuntu 12.04 LTS)为什么要用vim编辑py文件?因为在Linux命令行中,缺少图形界面的IDE,vim是最佳的文本编辑器,而为了更好的编辑py文本,所以配置vim。 1. 安装完整版vim vi和vim的区别? 在Linux自带有vi编辑器,而vim是指vi improved,即vi升级版
2016-03-18 21:31:20 347
原创 [python]我的第一只爬虫
我的第一只爬虫数据源 [ 糗百 ] http://www.qiushibaike.com/hot/page/2打开糗百主页,查看html源文件代码抓取作者名字#coding=utf-8import urllibimport urllib2import repage = 2url = 'http://www.qiushibaike.com/hot/page/' + str(page)
2016-03-16 18:52:13 356
转载 python 正则表达式
本文介绍了Python对于正则表达式的支持,包括正则表达式基础以及Python正则表达式标准库的完整介绍及使用示例。本文的内容不包括如何编写高效的正则表达式、如何优化正则表达式,这些主题请查看其他教程。注意:本文基于Python2.4完成;如果看到不明白的词汇请记得百度谷歌或维基,whatever。尊重作者的劳动,转载请注明作者及原文地址 >.html1. 正则表达式基础
2016-03-16 15:51:26 344
转载 慕课网 笔记:2016/3/14
慕课网 笔记:2016/3/14Python简介1989 龟叔python特点:优雅明确简单适合开发:web网站和各种网络服务系统工具和脚本作为胶水语言把其他语言开发的模块包装起来方便使用python不适合的领域:贴近硬件的代码移动开发游戏开发:C C++ 运行速度 代码量C 编
2016-03-14 21:56:49 772
转载 详解调试概念:单步执行、单步进入、强制进入、单步退出
关于JS、Java的调试,有下面几个概念。基本上所有的调试工具都支持,下面是四个概念的解释 单步执行:Step Over 就是一行一行的执行代码,但不一定会进入到所调用的代码里面,比如说,new了一个对象,但不一定会进入该对象构造方法里面。 单步进入:Step Into 就是调用了一个时,单步进入会进入到该方法里面,除
2016-03-14 19:05:26 7627
转载 切片,生成式,生成器,迭代
1,切片切片,从字面上理解意思应该差不多能够到位。就是从一个大块儿中切出来一片或者一块儿。这个大块儿的东西,在程序中可以是列表,元组,集合,字典,字符串等。举个例子,比如说从一个含有5个元素的列表中取出前三个元素,该怎么实现?如果没学切片之前,可以用循环实现,就像这样:但是如果使用python的切片操作,则很简单,就像是这样:可以看到,p
2016-03-14 15:48:23 747
转载 切片、切块、钻取和旋转
1 切片和切块(Slice and Dice)在多维数据结构中,按二维进行切片,按三维进行切块,可得到所需要的数据。如在“贷款银行、贷款质量、时间”三维立方体中进行切块和切片,可得到各贷款银行、各种贷款的统计情况。每次都是沿其中一维进行分割称为分片,每次沿多维进行的分片称为分块。钻取 旋转(转)" style="border:0px; max-width:100%; margin:0p
2016-03-14 15:32:29 6742
转载 理解 Python 中的 *args 和 **kwargs
Python是支持可变参数的,最简单的方法莫过于使用默认参数,例如:def test_defargs(one, two = 2): print 'Required argument: ', one print 'Optional argument: ', twotest_defargs(1)# result:# Required argument: 1# Optional
2016-03-13 18:32:57 1318
转载 TCP状态转移 LISTENING ESTABLISHED CLOSE_WAIT TIME_WAIT
TCP状态转移要点 TCP协议规定,对于已经建立的连接,网络双方要进行四次握手才能成功断开连接,如果缺少了其中某个步骤,将会使连接处于假死状态,连接本身占用的资源不会被释放。网络服务器程序要同时管理大量连接,所以很有必要保证无用连接完全断开,否则大量僵死的连接会浪费许多服务器资源。在众多TCP状态中,最值得注意的状态有两个:CLOSE_WAIT和TIME_WAIT。 1、LIST
2016-03-10 11:15:08 470
转载 Python IDLE 清屏插件
为idle增加一个清屏的扩展ClearWindow就可以了(在http://bugs.python.org/issue6143中可以看到这个扩展的说明)。下面我说安装使用的方法。首先下载clearwindow.py(点击可直接下载,不能下载的可以右键保存,格式为py结尾),将这个文件放在Python X\Lib\idlelib目录下(X为你的python版本),然后在这个目录下找到config-
2016-03-09 22:18:11 508
转载 Python爬虫系列:1
有2和3两个版本, 3比较新, 听说改动大. 根据我在知乎上搜集的观点来看, 我还是倾向于使用”在趋势中将会越来越火”的版本, 而非”目前已经很稳定而且很成熟”的版本. 这是个人喜好, 而且预测不一定准确. 但是如果Python3无法像Python2那么火, 那么整个Python语言就不可避免的随着时间的推移越来越落后, 因此我想其实选哪个的最坏风险都一样, 但是最好回报却是Python3的大.
2016-03-09 22:00:07 606
原创 【Python 脚本报错】AttributeError:‘module‘ has no attribute ‘xxx‘的解决方法
最近在编写Python脚本过程中遇到一个问题比较奇怪:Python脚本正常的,但执行报错"AttributeError: 'module'object has no attribute'xxx'",其实是.pyc文件存在问题。问题定位:查看import库的源文件,发现源文件存在且没有错误,同时存在源文件的.pyc文件问题解决方法:删除该库的.pyc文件,重新运行代码;或
2016-03-09 21:56:18 160811 8
转载 python 正则表达式
re模块包含对 正则表达式。本章会对re模块主要特征和正则表达式进行介绍。 什么是正则表达式正则表达式是可以匹配文本片段的模式。最简单的正则表达式就是普通字符串,可以匹配其自身。换包话说,正则表达式’python’ 可以匹配字符串’python’ 。你可以用这种匹配行为搜索文本中的模式,并且用计算后有值并发特定模式,或都将文本进行分段。 ** 通配符
2016-03-09 19:42:50 401
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人