Python
Sudouble
动静结合,持之以恒!
展开
-
Python简介
简述Python, 是一种面向对象、解释型计算机程序设计语言,由Guido van Rossum于1989年发明,第一个公开发行版发行于1991年。Python是纯粹的自由软件,源代码和解释器CPython遵循GPL协议。Python语法简洁清晰,特色之一是强制用空白符作为语句缩进。Python具有丰富和强大的库。它常被昵称为胶水语言,能够把用其他语言制作的各种模块(尤其是C/C++)很轻松地联结在转载 2016-04-13 23:04:55 · 1018 阅读 · 0 评论 -
Pybrain 使用
Pybrain是我前几天妄想识别验证码时使用的一个手段,此为背景。看了一篇文章后,看他说得比较准确,就暂时放弃对验证码进行破解工作。 这个是一位作者实践后的心得: http://www.cnblogs.com/sweetwxh/p/captcha_recognize.htmlPybrain总体来说还是很好用的,鉴于没有太多相关的教程,在这里贴出来供大家参考。 PyBrain(Pyt原创 2016-04-14 20:17:44 · 6868 阅读 · 4 评论 -
Python 爬验证码
主要实现功能: - 登陆网页 - 动态等待网页加载 - 验证码下载很早就有一个想法,就是自动按照脚本执行一个功能,节省大量的人力——个人比较懒。花了几天写了写,本着想完成验证码的识别,从根本上解决问题,只是难度太高,识别的准确率又太低,计划再次告一段落。 希望这次经历可以与大家进行分享和交流。Python打开浏览器相比与自带的urllib2模块,操作比较麻烦,针对于一部分网页还需要对cook原创 2016-04-13 22:55:30 · 4174 阅读 · 1 评论 -
Python 爬虫-爬取阿里旅行特价机票信息(1)
本着对于出游的向往,但又苦于没有找到合适的机票价格。于是,萌生了去获取相关网站的机票信息。一开始是想去获取全站机票信息,但是那个工作量太大,而且机票价格在一天时间里经常变更,给数据的爬取增加了极大的难度——拿到的数据都可以建个一样的机票价格查询网站了。最终决定只爬取关键部分的信息,其余的不做处理。目前的大致功能如下:获取特价机票信息选择出行的目的地根据目的地,输出相应省份的特价机票信息多了上原创 2016-07-29 11:01:01 · 9645 阅读 · 0 评论 -
Python 爬虫-爬取阿里旅行特价机票信息(3)——完结
上接(1)、(2)之前已经做到了可以查询这段时间里的特价机票消息,鉴于自己是个地理盲,有时候又想图个便宜出去溜达溜达,但目的地可能没有直接的航班,可能需要换成一下,于是有了现在的这个小功能。 现在补充上之前留下的那个功能:查询在中国的本省附近几个城市的特价机票信息。一、获取省市信息之前我的想法是从某一个网站进行在线查询,然后根据返回的结果获取,结果并没有合适的网站,最多也是需要在不停的在不同的网站原创 2016-09-01 22:07:11 · 5938 阅读 · 4 评论 -
Python 爬虫-爬取阿里旅行特价机票信息(2)
上接之前的(1)数据分析这里我查询的是 8月2号到 8月16号的特价机票信息,后面的那一串callback等可以不用改。网址在这里从数据中可以看出来,需要的数据主要集中在 Key值为‘flights’的字典里,接下来要做的事情就简单了。网页数据获取首先留出填入起始时间和结束时间的接口,然后就要去打开相应的网址。通过urllib的urlopen函数,我们就获得了这个网址的json数据。 因为数据里包原创 2016-08-02 16:02:20 · 4808 阅读 · 0 评论 -
Python集合(set)类型的操作
python的set和其他语言类似, 是一个无序不重复元素集, 基本功能包括关系测试和消除重复元素. 集合对象还支持union(联合), intersection(交), difference(差)和sysmmetric difference(对称差集)等数学运算. sets 支持 x in set, len(set),和 for x in set。作为一个无序的集合,sets不记录元素位置或者插转载 2017-09-13 09:55:51 · 311 阅读 · 0 评论