- 博客(11)
- 资源 (20)
- 问答 (1)
- 收藏
- 关注
原创 [Python]网络爬虫(四):Opener与Handler
在开始后面的内容之前,先来解释一下urllib2中的两个个方法:info and geturl urlopen返回的应答对象response(或者HTTPError实例)有两个很有用的方法info()和geturl()1.geturl():geturl()返回获取的真实的URL,这个很有用,因为urlopen(或者opener对象使用的)或许会有重定向。获取的URL或许跟请
2015-03-30 10:22:23 7409
转载 [Python]网络爬虫(三):异常的处理和HTTP状态码的分类
先来说一说HTTP的异常处理问题。当urlopen不能够处理一个response时,产生urlError。不过通常的Python APIs异常如ValueError,TypeError等也会同时产生。HTTPError是urlError的子类,通常在特定HTTP URLs中产生。 1.URLError通常,URLError在没有网络连接(没有路由到特定服务器),或者服务器不
2015-03-27 11:06:31 1476
转载 [Python]网络爬虫(二):利用urllib2通过指定的URL抓取网页内容
版本号:Python2.7.5,Python3改动较大,各位另寻教程。所谓网页抓取,就是把URL地址中指定的网络资源从网络流中读取出来,保存到本地。 类似于使用程序模拟IE浏览器的功能,把URL作为HTTP请求的内容发送到服务器端, 然后读取服务器端的响应资源。在Python中,我们使用urllib2这个组件来抓取网页。urllib2是Python的一个获取URLs
2015-03-25 23:18:13 1798
转载 [Python]网络爬虫(一):抓取网页的含义和URL基本构成
一、网络爬虫的定义网络爬虫,即Web Spider,是一个很形象的名字。把互联网比喻成一个蜘蛛网,那么Spider就是在网上爬来爬去的蜘蛛。网络蜘蛛是通过网页的链接地址来寻找网页的。从网站某一个页面(通常是首页)开始,读取网页的内容,找到在网页中的其它链接地址,然后通过这些链接地址寻找下一个网页,这样一直循环下去,直到把这个网站所有的网页都抓取完为止。如
2015-03-25 22:01:40 2805 1
转载 什么是BOM头
类似WINDOWS自带的记事本等软件,在保存一个以UTF-8编码的文件时,会在文件开始的地方插入三个不可见的字符(0xEF 0xBB 0xBF,即BOM)。它是一串隐藏的字符,用于让记事本等编辑器识别这个文件是否以UTF-8编码。对于一般的文件,这样并不会产生什么麻烦。但对于 PHP来说,BOM是个大麻烦。 PHP并不会忽略BOM,所以在读取、包含或者引用这些文件时,会把BOM作为该文件开头
2015-03-25 10:28:19 1045
转载 PHP命名空间(Namespace)的使用详解
命名空间一个最明确的目的就是解决重名问题,PHP中不允许两个函数或者类出现相同的名字,否则会产生一个致命的错误。这种情况下只要避免命名重复就可以解决对于命名空间,官方文档已经说得很详细[查看],我在这里做了一下实践和总结。命名空间一个最明确的目的就是解决重名问题,PHP中不允许两个函数或者类出现相同的名字,否则会产生一个致命的错误。这种情况下只要避免命名重复就可以解决,最常见的一种
2015-03-25 10:11:34 1364
原创 三种编程命名规则(匈牙利法,小驼峰法,大驼峰法)
一、匈牙利命名开头字母用变量类型的缩写,其余部分用变量的英文或英文的缩写,要求单词第一个字母大写。For example: long lSum = 0;"l"是类型的缩写; 二、小驼峰式:(little camel-case)第一个单词首字母小写,后面其他单词首字母大写。For example: string firs
2015-03-25 09:41:42 6361
转载 Notepad++ 快捷键 大全
Notepad++ 快捷键 大全Ctrl+C 复制Ctrl+X 剪切Ctrl+V 粘贴Ctrl+Z 撤消Ctrl+Y 恢复Ctrl+A 全选Ctrl+F 键查找对话框启动Ctrl+H 查找/替换对话框Ctrl+D 复制并粘贴当行Ctrl+L 删除当前行Ctrl+T 当行向上移动一行F3 查找下一个Shift+F3 查找上一个Ctrl+
2015-03-25 08:56:48 904
原创 使用PHP发送邮件
今天研究了一下使用PHP来发送电子邮件,总结了一下,有这么两种方法: 一、使用PHP内置的mail()函数看了一下手册,就直接开始写代码了,如下 [php] view plaincopy$to = "qvvp@foxmail.com"; //收件人 $subject = "Test"; //主题 $me
2015-03-24 13:35:29 2522
原创 随机预言机模型与标准模型
随机预言机模型: 在安全证明中,随机预言机模型通常是现实中哈希函数的理想化的替身。哈希函数是一个输入为任意长度,输出为固定长度的函数,除此之外还满足一些其它特性,例如单向性,抗碰撞性等。随机预言机的概念起源于Fiat和Shamir的把哈希函数看为随机的函数的思想,然后进一步由研究者Bellare和Rogaway转化为随机预言机模型。 在随机预言机模型下,通常设计一个
2015-03-05 15:59:13 9457 1
转载 Python Web框架----web.py 0.3 新手指南
开始URL处理GET和POST的区别启动服务模板表单数据库开发下一步做什么?开始你知道Python同时你希望制作一个网站。 那么web.py正好提供了一种简单的方法。如果你希望读完整个指南, 你需要安装Python, web.py, flup, psycopg2, 和Postgres (或者等价的数据库和Python驱动)。 详细,可以查看 webpy.org.如果
2015-03-03 09:47:22 2323
Python一日一练102----创建简易博客(下)源码
2015-01-27
SAE中Django1.7.3配置
2015-01-26
Windows Installer Clean Up
2015-01-06
django的model不能创建对应表
2015-01-14
TA创建的收藏夹 TA关注的收藏夹
TA关注的人