小黄鸡网页端 消息 接口 http报文
作者:http://www.cnblogs.com/hdl1992/
之前看过一篇博文(http://www.cnblogs.com/txw1958/archive/2013/02/07/weixin-if8-simsimi.html)也是调用小黄鸡网页端的消息接口,但是他的做法是直接用GET请求调用,但这样会被检测出来,导致不会返回正确的数据,只会返回{"response":"SimSimi is tired, I only can speak 200 time a day. Please visit again tomorrow. See ya~ ","id":1,"result":100,"msg":"OK."},原因应该是调用这个接口有限制。虽然直接用GET请求不行,但可以组装完整的http报文后在发送GET请求。
但在这之前需要做些准备工作——用wireshark这款软件抓取在小黄鸡网页端发送消息时的数据包。抓包情况如下:
发送消息的包
主要是看cookie的内容,因为太长了贴图看不到,后来经过试验得出cookie要包括这几个变量:sagree、selected_nc、JSESSIONID、AWSELB
接收消息的包
可以看出返回的数据是一个json数据
做到这里就可以组装一个完整的http报文调用小黄鸡的消息接口了,不过在这之前最好了解下http报文的格式。我是用php的curl功能进行调用,整个流程代码如下:
1 <?php 2 function simsimiHttp($keyword) 3 { 4 $JSESSIONID = 'JSESSIONID=B86064A18BB84AB21DF283963671E42C'; 5 $AWSELB = 'AWSELB=15E16D030EBAAAB8ACFf4BD9BB7E0CA8FB501388662941563CCCE3FBA00C1966E7EFC7E79C02 6 70B337A9EB2DC66B3E19A07708673470FDFA0B2C01AB735E6CC2ABE3DC5F3AF'; 7 //模拟http报文发送消息 8 $ch = curl_init('http://www.simsimi.com/func/req?lc=ch&msg='.$keyword); 9 $header = array("Accept: application/json, text/javascript, */*; q=0.01", 10 "X-Requested-With: XMLHttpRequest", 11 "User-Agent: Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) 12 Chrome/27.0.1453.116 Safari/537.36", 13 "Content-Type: application/json; charset=utf-8", 14 "Referer: http://www.simsimi.com/talk.htm", 15 "Accept-Encoding: gzip,deflate,sdch", 16 "Accept-Language: zh-cn,zh;q=0.8,en-us;q=0.5,en;q=0.3", 17 "Cookie: sagree=true; ".$AWSELB."; selected_nc=ch; ".$JSESSIONID, 18 "Connection: keep-alive" 19 ); 20 21 curl_setopt($ch, CURLOPT_HTTPHEADER, $header); 22 curl_setopt($ch, CURLOPT_HTTP_VERSION, CURL_HTTP_VERSION_1_1); 23 curl_setopt($ch,CURLOPT_RETURNTRANSFER,true); 24 $data = curl_exec($ch); 25 curl_close($ch); 26 27 return $data; 28 } 29 30 //转义特殊字符 31 function changeSpecialCharacter($str) 32 { 33 $str = str_replace(' ', '%20', $str); 34 $str = str_replace('@', '%40', $str); 35 $str = str_replace('#', '%23', $str); 36 $str = str_replace('%', '%25', $str); 37 $str = str_replace('&', '%26', $str); 38 $str = str_replace('(', '%28', $str); 39 $str = str_replace(')', '%29', $str); 40 $str = str_replace('+', '%2B', $str); 41 $str = str_replace('=', '%3D', $str); 42 $str = str_replace('<', '%3C', $str); 43 $str = str_replace('>', '%3E', $str); 44 $str = str_replace('"', '%22', $str); 45 $str = str_replace(',', '%2C', $str); 46 $str = str_replace('/', '%2F', $str); 47 $str = str_replace(':', '%3A', $str); 48 $str = str_replace(';', '%3B', $str); 49 $str = str_replace('?', '%3F', $str); 50 $str = str_replace('\\', '%5C', $str); 51 $str = str_replace('|', '%7C', $str); 52 53 return $str; 54 } 55 56 $keyword = 'hello world'; 57 echo simsimiHttp(changeSpecialCharacter($keyword)); 58 ?>
其中simsimiHttp是组装报文调用小黄鸡消息接口的函数,其中最主要的是仿造上面抓取的发送消息包的格式构造正确的http请求报文头。值得注意的是因为我们是用GET请求调用接口,需要把我们发送的消息添加到请求的url中,因此需要发送的消息中的特殊字符(例如空格,<,>这些字符)转义成正确的形式,所以要有changeSpecialCharacter这个函数。以上代码调用的结果为{"response":"侬好","id":24444807,"result":100,"msg":"OK."}。一开始还担心cookie的有效期的问题,但后来总结出不用担心这个问题,甚至不用担心cookie变量的值是否正确,只需要cookie包含那几个变量。
不过这个做法的效率不是很高,可能是因为小黄鸡的服务器在国外的原因,平均一次调用需要1秒左右的时间(在新浪SAE估计更慢)。
效率测试——使用Apache的ab功能,用10个并发完成30请求, 命令行为“ab -n 30 -c 10 http://localhost/test.php”,结果如下
因此,对响应速度要求比较高的应用不推荐使用这种做法。不过也可以尝试使用国外的服务器,这样的话响应速度应该会提高不少。