很早之前写过一个java爬虫,用来抓某网站妹子图片的,用到了httpclient包,但是没有认真理解方法,只是为了实现功能而拼凑了一个东西出来,当然也还为了好玩。
现在不一样了,已经决定了不考研,而又处于大三这个开始有找工作的压力的情况下,自然要开始学习磨炼自己的技术。再加上学习安卓网络编程正好用到了httpclient包,于是就下载了官方手册仔细的学了一学,现在在这里写下来我对第一部分(Post与get)相关的理解。
首先贴出下载链接:http://hc.apache.org/downloads.cgi
然后是官方官方教程:http://hc.apache.org/httpcomponents-client-4.5.x/tutorial/html/index.html
下面开始说说常用的方法。
GET:基本知识就不说了,网上一搜一大堆。这里讲讲怎么用发送get请求,获取网页的request。
1.用Httpclient的静态方法获取一个CloseableHttpClient的 对象(CloseableHttpClient httpclient = HttpClients.createDefault();)
2.获取一个HttpGet对象,并传入想要get的url(HttpGet httpGet = new HttpGet(url);)
3.通过httpClient.execute(httpGet)返回一个CloseableHttpResponse的服务器返回的response
4.将调用response的getEntity()方法,返回一个HttpEntity对象entity
5.调用entity的getContent方法返回一个输入流
6.常规的把输入流处理为String就可以利用正则表达式获取自己想要的信息了。
其中,如果要给get方法带上参数,则需要构建uri,比