java的网络编程中一个重要的类就是Socket类,这个类封装了java的套接字操作。
首先,来看一下这个类的主要的构造函数
Socket() 创建一个未连接的套接字,并使用系统默认类型的SocketImpl。
Socket(InetAddress address, int port) 创建流套接字并将其连接到指定IP地址的指定端口号。
Socket(String host, int port)
创建流套接字并将其连接到指定主机上的指定端口号。
一般来说,第一个和最后一个构造函数使用的比较多,但是最后一个构造函数存在一个问题,那就是如果这个套接字没有连接上,那么会一直处于阻塞状态。所以一般使用的时候,需要这样使用
URL url = new URL(urlstr);
socket = new Socket();
socket.connect(new InetSocketAddress(url.getHost(),80));
这里URL类用来根据所给的String类型的url地址来创建一个URL实例,这个实例封装了URL的一些特征,并且提供了相应的set和get函数来获取这些特征,比如协议,主机,以及端口。
然后,再来看一下Socket这个类的常用的函数
close() 关闭这个套接字
connect(SocketAddress endpoint) 将此套接字连接到服务器。
connect(SocketAddress endpoint, int timeout) 将此套接字连接到具有指定超时值的服务器。
getInputStream() 返回此套接字的输入流。
getOutputStream() 返回此套接字的输出流。
还有一些设定套接字状态的其他函数,以及判断套接字是否打开的函数,这里就不一一赘述了,如果有兴趣可以看看API文档。
下面以一个简单的Demo来总结一下
package cn.ljtnono.net;
import java.io.BufferedReader;
import java.io.BufferedWriter;
import java.io.IOException;
import java.io.InputStream;
import java.io.InputStreamReader;
import java.io.OutputStream;
import java.io.OutputStreamWriter;
import java.net.InetSocketAddress;
import java.net.MalformedURLException;
import java.net.Socket;
import java.net.URL;
import java.net.UnknownHostException;
public class SpiderDemo1 {
public static void main(String[] args) throws MalformedURLException {
BufferedWriter bw = null;
BufferedReader br = null;
Socket socket = null;
String urlstr = "http://www.ljtnono.cn/jsgl/";
URL url;
try {
url = new URL(urlstr);
System.out.println(url.getHost());
socket = new Socket();
socket.connect(new InetSocketAddress(url.getHost(),80));
socket.setSoTimeout(10000);
OutputStream outputStream = socket.getOutputStream();
bw = new BufferedWriter(new OutputStreamWriter(outputStream));
bw.write("GET " + urlstr + " HTTP/1.0\r\n");
bw.write("HOST:" + "118.89.247.210" + "\r\n");
bw.write("\r\n");
bw.flush();
// bw.write("GET " + urlPojo.getUrl() + " HTTP/1.0\r\n");
// bw.write("HOST:" + host + "\r\n");
// //在行的结束符\r\n之前没有任何数据,说明 这时候代表协议族 http header输出给服务端完成
// bw.write("\r\n");
// bw.flush();
InputStream inputStream = socket.getInputStream();
br = new BufferedReader(new InputStreamReader(inputStream,"UTF-8"));
String line = null;
while ((line = br.readLine()) != null) {
System.out.println(line);
}
} catch (UnknownHostException e) {
// TODO Auto-generated catch block
e.printStackTrace();
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
} finally {
try {
if (br != null) {
br.close();
}
if (bw != null) {
bw.close();
}
if (socket != null) {
socket.close();
}
} catch (IOException e) {
// TODO: handle exception
e.printStackTrace();
}
}
}
}
这个例子使用Socket套接字发送HTTP请求到服务器,然后将服务器相应的文本打印出来。
结果如下:
www.ljtnono.cn
HTTP/1.1 200
Set-Cookie: JSESSIONID=F17B1A79492D26D62B4C3C4F6693D23A; Path=/jsgl; HttpOnly
Content-Type: text/html;charset=utf-8
Content-Length: 5869
Date: Wed, 31 Oct 2018 15:02:17 GMT
Connection: close
loginvar _hmt = _hmt || [];
(function() {
var hm = document.createElement("script");
hm.src = "https://hm.baidu.com/hm.js?fdc4cac3037f60100589fdd0cdd7b67a";
var s = document.getElementsByTagName("script")[0];
s.parentNode.insertBefore(hm, s);
})();