最近在几周在做手游崩溃信息收集和上传,拿到崩溃信息后,使用的是HTTP的POST方法上传到公司共用的服务器的,因此做简单总结。本文首先简单介绍了HTTP协议,主要说明了POST方法和GET方法的区别;然后用Python实现了 对POST方法和GET方法的响应;最后用Python模拟了POST方法和GET方法的请求。
HTTP协议简介
HTTP是Hyper Text Transfer Protocol(超文本传输协议)的缩写,简单来说它是一个应用层的协议,它允许将超文本标记语言(HTML)文档从Web服务器传送到客户端的浏览器。HTTP是一个无状态的协议,即同一个客户端的这次请求和上次请求是没有对应关系,对http服务器来说,它并不知道这两个请求来自同一个客户端,为了解决这个问题,Web程序引入了Cookie机制来维护状态。
HTTP协议通常基于TCP协议来实现的,有时也基于于TLS或SSL协议(这个两个协议也是基于TCP协议来说实现)来实现,这个时候,就成了我们常说的HTTPS,每次HTTP操作都至少有下面几个过程:首先客户端与服务端建立连接;建立建立后,客户端按照协议格式发送请求;服务端接到请求后,同样按照某个格式返回响应数据;最后客户端与服务端断开连接。
通常我们打开一个网页,需要浏览器发送多次请求,因为一个网页中可能引用了其他文件,比如图片等文件,这时候浏览器会自动再次发送请求去获取图片等数据,直到网页上的数据被完全显示出来。
POST和GET区别
HTTP协议定义了很多与服务器交互的方法,最基本的有4种,分别是GET,POST,PUT,DELETE. 一个URL地址用于描述一个网络上的资源,而HTTP中的GET, POST, PUT, DELETE就对应着对这个资源的查,改,增,删4个操作,其中最常见请求方式是GET和POST,并且现在浏览器一般只支持GET和POST方法。GET一般用于获取/查询资源信息,而POST一般用于更新资源信息,他们之间主要区别如下:
1)根据HTTP规范,GET用于信息获取,而且应该是安全的和幂等的,这里安全是指该操作用于获取信息而非修改信息,幂等是指对同一URL的多个请求应该返回同样的结果(这一点在实质实现时,可能并不满足);
POST表示可能修改变服务器上的资源的请求。
2)GET请求的数据会附在URL之后(就是把数据放置在HTTP协议头中),以?分割URL和传输数据,参数之间以&相连,如果数据是英文字母/数字,原样发送,如果是空格,转换为+,如果是中文/其他字符,
则直接把字符串用BASE64编码;POST把提交的数据则放置在是HTTP包的包体中。
3)因为GET是通过URL提交数据,那么GET可提交的数据量就跟URL的长度有直接关系,理论上URL长度是没有限制的,即HTTP协议没有规定URL的长度,但在实质中,特定的浏览器可能对这个长度做了限制;理论上POST也是没有大小限制的,HTTP协议规范也没有进行大小限制,但在服务端通常会对这个大小做一个限制,当然这个限制比GET宽松的多,即使用POST可以提交的数据量比GET大得多。
最后,网上有人说,POST的安全性要比GET的安全性高,实质上POST跟GET都是明文传输,这可以通过类似WireShark工具看到。总之,Get是向服务器发索取数据的一种请求,而Post是向服务器提交数据的一种请求。
POST和GET方法响应Python实现
下面代码实现对POST方法和GET方法的响应:
- #!/usr/bin/python
- #coding=utf8
- """
- import sys
- reload(sys)
- sys.setdefaultencoding('utf-8')
- """
- from BaseHTTPServer import BaseHTTPRequestHandler,HTTPServer
- from os import curdir, sep
- import cgi
- import logging
- import time
- PORT_NUMBER = 8080
- RES_FILE_DIR = "."
- class myHandler(BaseHTTPRequestHandler):
- def do_GET(self):
- if self.path=="/":
- self.path="/index_example3.html"
- try:
- #根据请求的文件扩展名,设置正确的mime类型
- sendReply = False
- if self.path.endswith(".html"):
- mimetype='text/html'
- sendReply = True
- if self.path.endswith(".jpg"):
- mimetype='image/jpg'
- sendReply = True
- if self.path.endswith(".gif"):
- mimetype='image/gif'
- sendReply = True
- if self.path.endswith(".js"):
- mimetype='application/javascript'
- sendReply = True
- if self.path.endswith(".css"):
- mimetype='text/css'
- sendReply = True
- if sendReply == True:
- #读取相应的静态资源文件,并发送它
- f = open(curdir + sep + self.path, 'rb')
- self.send_response(200)
- self.send_header('Content-type',mimetype)
- self.end_headers()
- self.wfile.write(f.read())
- f.close()
- return
- except IOError:
- self.send_error(404,'File Not Found: %s' % self.path)
- def do_POST(self):
- logging.warning(self.headers)
- form = cgi.FieldStorage(
- fp=self.rfile,
- headers=self.headers,
- environ={'REQUEST_METHOD':'POST',
- 'CONTENT_TYPE':self.headers['Content-Type'],
- })
- file_name = self.get_data_string()
- path_name = '%s/%s.log' % (RES_FILE_DIR,file_name)
- fwrite = open(path_name,'a')
- fwrite.write("name=%s\n" % form.getvalue("name",""))
- fwrite.write("addr=%s\n" % form.getvalue("addr",""))
- fwrite.close()
- self.send_response(200)
- self.end_headers()
- self.wfile.write("Thanks for you post")
- def get_data_string(self):
- now = time.time()
- clock_now = time.localtime(now)
- cur_time = list(clock_now)
- date_string = "%d-%d-%d-%d-%d-%d" % (cur_time[0],
- cur_time[1],cur_time[2],cur_time[3],cur_time[4],cur_time[5])
- return date_string
- try:
- server = HTTPServer(('', PORT_NUMBER), myHandler)
- print 'Started httpserver on port ' , PORT_NUMBER
- server.serve_forever()
- except KeyboardInterrupt:
- print '^C received, shutting down the web server'
- server.socket.close()
- fileitem = form["userfile"]
- if fileitem.file:
- linecount = 0
- while 1:
- line = fileitem.file.readline()
- if not line: break
- linecount = linecount + 1
下面代码实现了GET方法的请求:
- #!/usr/bin/env python
- #coding=utf8
- import httplib
- httpClient = None
- try:
- httpClient = httplib.HTTPConnection('localhost', 8080, timeout=30)
- httpClient.request('GET', '/test0.html')
- #response是HTTPResponse对象
- response = httpClient.getresponse()
- print response.status
- print response.reason
- print response.read()
- except Exception, e:
- print e
- finally:
- if httpClient:
- httpClient.close()
- #!/usr/bin/env python
- #coding=utf8
- import httplib, urllib
- httpClient = None
- try:
- params = urllib.urlencode({'name': 'Maximus', 'addr': "GZ"})
- headers = {"Content-type": "application/x-www-form-urlencoded"
- , "Accept": "text/plain"}
- httpClient = httplib.HTTPConnection("localhost", 8080, timeout=30)
- httpClient.request("POST", "/test0.html", params, headers)
- response = httpClient.getresponse()
- print response.status
- print response.reason
- print response.read()
- print response.getheaders() #获取头信息
- except Exception, e:
- print e
- finally:
- if httpClient:
- httpClient.close()
http://www.cnblogs.com/TankXiao/archive/2012/02/13/2342672.html
http://www.cnblogs.com/hyddd/archive/2009/03/31/1426026.html
http://www.acmesystems.it/python_httpserver
http://georgik.sinusgear.com/2011/01/07/how-to-dump-post-request-with-python/
http://www.01happy.com/python-httplib-get-and-post/
https://docs.python.org/2/library/basehttpserver.html#module-BaseHTTPServer