Python
文章平均质量分 56
Thare_Lam
Hello World。
展开
-
黑板课爬虫闯关第一关
黑板课爬虫闯关—第一关刚开始学习python,看了些语法后就想找些小例子来写写。因为语言这东西光看不写是不行的。知乎上看到大家各种说python写的网络爬虫非常nb的样子,便也想来搞搞。正好又看到黑板课老师在知乎的回答,一不小心点进了黑板课爬虫闯关,于是踏上了闯关的征程。第一题比较简单,就是根据网页给的数字不断更新网址后的数字,直到提示进入下一关为止。分析一下大概思路:用python获取网页,然后原创 2015-10-14 18:04:40 · 4079 阅读 · 0 评论 -
黑板客爬虫闯关第二关
这一关相比第一关反而更容易,因为不需要进行复杂的正则判断,只需要用循环尝试密码即可。这里需要用到requests的post请求,并在请求里加上用户名和密码即可。# coding=utf-8import requestswrongNotify = '您输入的密码错误, 请重新输入'website = 'http://www.heibanke.com/lesson/crawler_ex01/'in原创 2015-10-14 18:19:35 · 2813 阅读 · 0 评论 -
黑板课爬虫闯关第三关
前面两关算是比较容易,第三关就有些难度了,因为还需要有web方面的知识才能想到方法。第二关结束后,点击下一关,出来以下页面:乍一看还以为进错了,先不管,注册登录再说。登录后才进入这个页面:题目说比上一关多了两层保护,我们可以看到顶部有个注销按钮,也就是说首先要先登录才能继续做题。根据我那薄弱的web知识,当时第一想法就是:第一,通过增加header伪装浏览器;第二,拿我当前登录的cookie去登录。原创 2015-10-14 19:03:35 · 3973 阅读 · 0 评论 -
黑板客爬虫闯关第四关
上学期太忙了,第四关也就一直没去捣鼓(严重拖延症)。今天天气不错,也就抽点时间来整了整。 这一关的核心是Python多线程。密码总共有13页,每一页出现的密码是随机的。也就是说,即使你从第一页翻到最后一页,每一位的密码也不一定能全部获得。而且你会发现,页面载入速度非常慢(这是黑板课老师故意的),这样可以很好地使用Python多线程。Python的多线程和Java多线程不太一样:“Python的多线原创 2016-03-12 14:34:03 · 1843 阅读 · 0 评论 -
Python __getattribute__、__getattr__、__get__总结
先上一段代码:class MyClass(object): v1 = 1 def __getattribute__(self, *args, **kwargs): print '__getattribute__' return object.__getattribute__(self, *args, **kwargs) def __getattr_原创 2017-03-08 13:19:11 · 732 阅读 · 0 评论 -
Python使用socket传输文件
昨晚的高网实验要求用Socket编程实现两台机器的文件传输,还要记录传输时间并进行MD5验证,于是便用python简单实现了下。 过程其实挺简单,先建立两个进程的TCP连接,然后client先向server发送文件信息(包括文件名和文件大小以及MD5值),这个文件信息的大小是预先设定好的,也就是client和server都知道,这样server才能准确判断接收的数据哪些是文件信息哪些是真正的文件。原创 2015-10-30 09:33:35 · 16099 阅读 · 5 评论