Python
文章平均质量分 59
KingLearnJava
这个作者很懒,什么都没留下…
展开
-
xpath提取多个标签下的text
我左青龙,右白虎,上朱雀,下玄武。老牛在当中,龙头在胸口。使用xpath的string(.)data = selector.xpath('//div[@id="test3"]')info = data.xpath('string(.)').extract()转载 2015-10-16 11:31:00 · 1991 阅读 · 0 评论 -
Python 遍历目录找出包含指定字符串的文件夹
题目:编写一个程序,能在当前目录以及当前目录的所有子目录下查找文件名包含指定字符串的文件,并打印出相对路径题目不难,但是初接触Python,对函数不够熟悉,犯了不少错误。总结如下:os.path.isdir()方法应该传入带绝对路径的文件名,如:r'e:\java',如果只是传入文件名,如'java',该方法只会在当前工作目录(可以用os.getcwd()查看)下查找有没有同名文件原创 2015-10-14 21:28:45 · 4026 阅读 · 0 评论 -
Python 登录网站后台
import urllib.parse, urllib.request, http.cookiejar import webbrowser# 设置cookiedef set_cookie(): # 初始化一个CookieJar来处理Cookie cookie = http.cookiejar.CookieJar() cookieProc = urllib原创 2015-10-15 18:34:27 · 1353 阅读 · 0 评论 -
Python 包管理工具解惑
本文转载自:Python 包管理工具解惑一、困惑作为一个 Python 初学者,我在包管理上感到相当疑惑(嗯,是困惑)。主要表现在下面几个方面:这几个包管理工具有什么不同? distutilssetuptoolsdistributedisutils2distlibpip什么时候该用pip,什么时候该用 setup.py ,它们有关系么?easy_install、ez_setup.p转载 2015-10-28 15:43:24 · 541 阅读 · 0 评论 -
Sublime Text 3 运行Python控制台不能输出中文的解决方法
默认的编译器可以直接按Ctrl+B编译运行Python,并在控制台输出结果.美中不足的是无法输出中文,需要自己手动配置一番。在Sublime Text 3 中依次点击菜单Tools->build system->New build system,粘贴下方的代码并保存为Python.sublime-build。重启Sublime即可。{ "cmd": ["python","-u"原创 2015-10-13 23:37:05 · 15097 阅读 · 7 评论 -
Python 3 爬虫之批量下载字帖图片
朋友想下载这62个网页中的字帖图片:http://www.yac8.com/news/11003.html一、要点1. Chrome 「审查元素」中看到的源代码与真实的源码不同。2. 图片网址附近源码: 获取源码的正则表达式:]*?src="(.+?\.jpg)"[^>]*?>建议使用Expresso,带有语义分析功能3. 网页编码是GB2312:原创 2015-10-19 11:58:10 · 1391 阅读 · 0 评论 -
Sublime Text 3 控制台运行Python无法输出中文
点击 Preferences → Browse Packages,进入Users文件夹,用Sumblime Text打开Python.sublime-build文件,修改encoding的值如下:"encoding": "cp936"保存并关闭。然后在Sublime Text中把编译系统设置为自己定义的Python。我的软件里有两个Python选项,第二个才是上述方法定义的。原创 2015-10-12 14:42:51 · 1383 阅读 · 0 评论 -
Python 3 爬虫之查询Github上哪些用户名没有被注册
想换个又短又有内涵还没什么用的ID,想了几个一直被注册。于是找来一份六千多个单词的文件,用爬虫挨个上Gibhub试。写的时候还不会多线程,单线程发一次请求就停几秒,否则很快被拒绝访问。还好不是封IP。抓完又觉得这样起名没意思。就当一次爬虫练习吧。#!/usr/bin/env python# -*- coding: utf-8 -*-# @Author: LostInNigh原创 2015-10-29 18:33:37 · 1629 阅读 · 0 评论 -
Python 3 爬虫之抓取当当网特价书名
网址:http://promo.dangdang.com/subject.php?pm_id=1501519&tag_id=&sort=price_asc&province_id=137&p=871要点:Chrome审查功能看到的源码与Python爬虫真实获取的源码有出入,写正则表达式时应该参照后者。该网页的最大页面数会变化,每次解析都要重新提取一次。没加入异常处理,也没使原创 2015-10-22 15:44:26 · 1648 阅读 · 0 评论 -
Sublime Text 3 装了Anaconda 写Python代码出现框框的解决办法
Sublime Text 3代码提示插件Anaconda下载:http://damnwidget.github.io/anaconda/#carousel-features安装后写代码出现白框:光标移到白框行,下方状态栏里可以看到错误信息:可见原因是代码不符合PEP 8 规范。规范摘要见:http://blog.sae.sina.com.原创 2015-10-21 17:41:04 · 29559 阅读 · 0 评论 -
【Python 笔记】selenium 简介
Selenium 是ThoughtWorks专门为Web应用程序编写的一个验收测试工具。Selenium测试直接运行在浏览器中,就像真正的用户在操作一样。支持的浏览器包括IE(7、8、9)、Mozilla Firefox、Mozilla Suite等。这个工具的主要功能包括:测试与浏览器的兼容性——测试你的应用程序看是否能够很好得工作在不同浏览器和操作系统之上。测试系统功能——创建回归测试检验软件原创 2015-10-15 21:35:47 · 4967 阅读 · 1 评论 -
Python 3 安装 lxml 报错Unable to find vcvarsall.bat的解决方法
lxml是一个解析XML的包,用pip命令安装时提示出错:error: Microsoft Visual C++ 10.0 is required (Unable to find vcvarsall.bat).安装了Microsoft Visual C++ 10.0仍然提示此错误。折腾了两天后终于找到办法:1. 安装wheel,命令行运行:pip install wheel原创 2015-10-28 16:04:17 · 2285 阅读 · 0 评论 -
代码中执行命令行-Python与Java版
这里的命令是指在开始-->运行里输的命令,如:ping www.baidu.com要运行dos命令,如dir,直接在开始-->运行里执行会报错,此时需要调用cmd来执行dir,完整命令为:cmd /k dir参数说明:/k 表示执行完命令后不关闭cmd窗口/c 表示执行完命令后关闭cmd窗口/k或/c后还可以加一个start,表示在新的cmd窗口中执行后面的命令以下代码原创 2015-10-16 16:45:49 · 2235 阅读 · 0 评论 -
Python 3 转换真实、迅雷、QQ旋风下载地址
#!/usr/bin/env python# -*- coding: utf-8 -*-# 真实、迅雷、QQ旋风下载地址之间的转换import base64import urllibimport re__Author__ = "LostInNight"'''原理:迅雷下载地址:"thunder://"+Base64编码("AA"+"真实地址"+"ZZ")QQ旋风下载地址:原创 2015-11-03 18:38:52 · 5110 阅读 · 0 评论 -
Python 3 之 Chrom 截获的Headers转成dict格式
如题,直接复制Chrom截获的Headers如下:Accept:text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8Accept-Encoding:gzip, deflate, sdchAccept-Language:zh-CN,zh;q=0.8Connection:keep-aliveCo原创 2015-10-31 23:32:11 · 2834 阅读 · 1 评论