User Agent中文名为用户代理,是Http协议中的一部分,属于头域的组成部分,User Agent也简称UA。它是一个特殊字符串头,是一种向访问网站提供你所使用的浏览器类型及版本、操作系统及版本、浏览器内核、等信息的标识。通过这个标识,用户所访问的网站可以显示不同的排版从而为用户提供更好的体验或者进行信息统计;例如用手机访问谷歌和电脑访问是不一样的,这些是谷歌根据访问者的UA来判断的。UA可以进行伪装。(wiki)
分析浏览器的User-Agent 我们可以收集客户端相关信息:是否手机、操作系统、浏览器等信息。
效果:http://1.billo.sinaapp.com/
以下为获取json格式ua的函数
ua为字符串格式的 User-Agent 字段
import urllib
import urllib2
import json
def getUA(ua):
ua = urllib.quote(ua)
url = "http://www.useragentstring.com/?uas=%s&getJSON=all" %ua
keys = {
"Host":"www.useragentstring.com",
"User-Agent":"Mozilla/5.0 (Windows NT 6.4; WOW64; rv:35.0) Gecko/20100101 Firefox/35.0"
}
req = urllib2.Request(url)
for key in keys:
req.add_header(key,keys[key])
j = urllib2.urlopen(req).read()
j = json.loads(j)
return j
request.headers['User-Agent'] 可以返回 User-Agent 的字符串
然后通过useragentstring这个网站的api可以获得一个解析后的User-Agent的json