Python
文章平均质量分 80
Willib
趁自己还年轻,给自己一个牛逼的机会
展开
-
BeautifulSoup 提取某个tag标签里面的内容
用的版本是BeautifulSoup4,用起来的确要比 re 好用一些,不用一个个的去写正则表达式,这样还是挺方便的。比如我要获取高匿代理IP页面上的IP和端口,网址这里:点击打开链接,它的组织方式是这样的,如下图:IP和端口 tr.td 标签里面,tr有class属性,属性有两种情况的值,对于这点我们可以用正则表达式来匹配下。当提取某一个标签里的具体内容时,可以用bs的 .str原创 2016-08-19 00:49:16 · 80637 阅读 · 4 评论 -
Python爬虫设置代理IP爬取知乎图片
本文接着前面两文中提到的内容来继续完善我们的Python爬虫。上文地址:通过Python爬虫爬取知乎某个问题下的图片设置代理的方式很简单,可以看看这里Requests的官方文档,这里也有对应的中文版介绍,点击打开链接先简单说下requests代理的使用,摘自上述提到的文档:如果需要使用代理,你可以通过为任意请求方法提供 proxies 参数来配置单个请求:impor原创 2016-08-31 00:34:05 · 19766 阅读 · 2 评论 -
通过Python爬虫爬取知乎某个问题下的图片
该爬虫主要是通过requests来实现的,该模块完全可以很好的代替urllib和urllib2,而且功能更强大,详细可以看这里。同时也用到了pillow模块中的image对象,实现环境是Python2,不过在Python3上只需很小的改动就可以正常运行。首先通过cookie模拟登陆到知乎,然后获取知乎某一个问题的链接,打开并获取该问题回答下的图片,然后保存到本地。我们先看下知乎中的网页原创 2016-07-10 21:36:33 · 23390 阅读 · 16 评论 -
基于Python Web应用的Web服务器之间的比较
介绍在这篇文章中,我们将主要讨论三件事情:Python, Web Servers, 还有最重要的一点是讨论这两者之间一些七零八碎的关系。撇开笑话不谈,这篇相当长的文章对于那些正在找寻快捷的指导方法或者答案的人来说可能是不合时宜的。不幸的是,不像Python世界中的大多数事情那样,当谈到选择一个产品服务栈来部署你的应用时,这里没有一个明显的方法来教你怎样做或者说哪一个更合适。值得庆幸的是,这不应翻译 2017-03-24 15:27:03 · 3521 阅读 · 0 评论 -
Python中的函数装饰器
先上文档 Function definitions ,如果只是想简单的知道怎么使用函数装饰器,那先看看下面这个例子:def makebold(fn): print("I'm bold") def wrapped(): return "<b>" + fn() + "</b>" return wrappeddef makeitalic(fn): print原创 2017-03-16 22:41:08 · 1232 阅读 · 0 评论 -
Python中的默认参数值
本文主要内容翻译自:点击打开链接Python处理默认参数值的方式是少数几个难住Python初学者的问题之一(当然通常也就难住第一次)。造成这种困惑的主要原因是当你使用一个可变的对象作为默认参数值时,也就是说,这个默认值会在某些时候被修改,比如一个list对象或者一个dictionary对象。 举一个例子:>>> def function(data=[]):... data.append(原创 2017-02-20 22:57:10 · 1996 阅读 · 0 评论