python
文章平均质量分 81
Sunshine_top
安安静静、认认真真完成自己的事情
展开
-
信息融合的杂贴
Makefile: http://wiki.ubuntu.org.cn/index.php?title=跟我一起写Makefile:概述&variant=zh-cng++参数介绍:http://www.cnblogs.com/lidan/archive/2011/05/25/2239517.html -lm 参数表示“链接数学库”,在自己编写的获取天气信息的C程序“原创 2014-10-24 08:51:53 · 1471 阅读 · 0 评论 -
Python爬虫(一):基本概念
网络爬虫的定义 网络爬虫(Web Spider,又被称为网页蜘蛛,网络机器人,又称为网页追逐者),是一种按照一定的规则,自动的抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁,自动索引,模拟程序或者蠕虫。如果把互联网比喻成一个蜘蛛网,那么Spider就是在网上爬来爬去的蜘蛛。 网络蜘蛛是通过网页的链接地址来寻找网页的。从网站某一个页面(通常是首页)原创 2015-03-15 11:53:48 · 3228 阅读 · 0 评论 -
python提取网页的特定内容(正则表达式实现)
关于正则表达式参考正则表达式python可以很方便地抓取网页并过滤网页的内容,那么,如何从如下的网页中提取csdn文章的标题“《unix网络编程(卷1)源代码的使用方法》”。 window.quickReplyflag = true; 《unix网络编程(卷1)》源代码的使原创 2015-03-16 19:33:19 · 31550 阅读 · 0 评论 -
正则表达式
http://www.jb51.net/tools/zhengze.html#resources目录跳过目录本文目标如何使用本教程正则表达式到底是什么东西?入门测试正则表达式元字符字符转义重复字符类分枝条件反义分组后向引用零宽断言负向零宽断言注释贪婪与懒惰处理选项平衡组/递归匹配还有些什么东西没提到联系作者网上的资源及本文参考文献更新纪录本文目标30分钟内让你明白正则表转载 2015-01-10 19:53:44 · 2948 阅读 · 0 评论 -
从请求的头获取信息
1、当请求的url超时时,从头部获取信息用requests爬虫拒绝301/302页面的重定向而拿到Location(重定向页面URL)的方法http://blog.csdn.net/mao_code/article/details/54017708requests:http://docs.python-requests.org/zh_CN/latest/user/q转载 2017-11-14 11:34:11 · 893 阅读 · 0 评论 -
python nosetests
https://www.cnblogs.com/xueli/p/4970905.htmlpython除了unittest,还有一款更快捷的nose,nose可以说是对unittest的一种简化吧但是他不需要unittest那种必须有固有的格式,他只需要文件,类名,方法名等含有test就可以unittest是需要手动来写discover函数来遍历用例的Name转载 2017-11-30 11:53:45 · 4035 阅读 · 1 评论