一、网络编程概述
1.1 概述
- Java是 Internet 上的语言,它从语言级上提供了对网络应用程序的支持,程序员能够很容易开发常见的网络应用程序。
- Java提供的网络类库,可以实现无痛的网络连接,联网的底层细节被隐藏在 Java 的本机安装系统里,由 JVM 进行控制。并且 Java 实现了一个跨平台的网络库,程序员面对的是一个统一的网络编程环境。
1.2 网络基础
- 把分布在不同地理区域的计算机与专门的外部设备用通信线路互连成一个规模大、功能强的网络系统,从而使众多的计算机可以方便地互相传递信息、共享硬件、软件、数据信息等资源。
- 网络编程的目的:
直接或间接地通过网络协议与其它计算机实现数据交换,进行通讯。 - 网络编程中有两个主要的问题:
➢ 如何准确地定位网络上一台或多台主机;定位主机上的特定的应用;
➢ 找到主机后如何可靠高效地进行数据传输。
二、网络通信要素概述
2.1 如何实现网络中的主机互相通信
- 通信双方地址
➢ IP
➢ 端口号 - 一定的规则(即:网络通信协议。有两套参考模型)
➢ OSI参考模型:模型过于理想化,未能在因特网上进行广泛推广
➢ TCP/IP参考模型(或TCP/IP协议):事实上的国际标准。
2.2 网络通信协议
三、通信要素
3.1 IP
➢ 唯一的标识 Internet 上的计算机(通信实体)
➢ 本地回环地址(hostAddress):127.0.0.1 主机名(hostName):localhost
➢ IP地址分类方式1:IPV4 和 IPV6
- IPV4:4个字节组成,4个0-255。大概42亿,30亿都在北美,亚洲4亿。2011年初已
经用尽。以点分十进制表示,如192.168.0.1 - IPV6:128位(16个字节),写成8个无符号整数,每个整数用四个十六进制位表示,数之间用冒号(:)分开,如:3ffe:3201:1401:1280:c8ff:fe4d:db39:1984
➢ IP地址分类方式2:公网地址(万维网使用)和私有地址(局域网使用)。192.168.开头的就是私有址址,范围即为192.168.0.0–192.168.255.255,专门为组织机构内部使用
➢ 特点:不易记忆
Internet上的主机有两种方式表示地址:
➢域名(hostName):www.java.com
➢IP 地址(address):202.108.35.210
InetAddress类主要表示IP地址,两个子类:Inet4Address、Inet6Address。
InetAddress 类对象含有一个 Internet 主机地址的域名和 IP 地址:www.java.com 和 202.108.35.210。
域名容易记忆,当在连接网络时输入一个主机的域名后,域名服务器(DNS)
负责将域名转化成IP地址,这样才能和主机建立连接。 -------域名解析
InetAddress类没有提供公共的构造器,而是提供了如下几个静态方法来获取InetAddress实例
➢public static InetAddress getLocalHost()
➢public static InetAddress getByName(String host)
InetAddress提供了如下几个常用的方法
➢public String getHostAddress():返回 IP 地址字符串(以文本表现形式)。
➢public String getHostName():获取此 IP 地址的主机名
➢public boolean isReachable(int timeout):测试是否可以达到该地址
public class TestAddress {
public static void main(String[] args) throws IOException {
InetAddress address = InetAddress.getByName("127.0.0.1");
System.out.println(InetAddress.getLocalHost());
System.out.println(address.getAddress());
System.out.println(address.getCanonicalHostName());
System.out.println(address.getHostAddress());
System.out.println(address.getHostName());
boolean reachable = address.isReachable(1000);
System.out.println(reachable);
System.out.println(InetAddress.getLocalHost());
}
}
3.2 Port
-
端口号标识正在计算机上运行的进程(程序)
➢ 不同的进程有不同的端口号
➢ 被规定为一个 16 位的整数 0~65535。
➢ 端口分类:
➢ 公认端口:0~1023。被预先定义的服务通信占用(如:HTTP占用端口80,FTP占用端口21,Telnet占用端口23)
➢ 注册端口:1024~49151。分配给用户进程或应用程序。(如:Tomcat占用端口8080,MySQL占用端口3306,Oracle占用端口1521等)。
➢ 动态/私有端口:49152~65535。 -
端口号与IP地址的组合得出一个网络套接字:Socket。
3.3 网络协议
- 计算机网络中实现通信必须有一些约定,即通信协议,对速率、传输代码、代码结构、传输控制步骤、出错控制等制定标准。
- 问题:网络协议太复杂
计算机网络通信涉及内容很多,比如指定源地址和目标地址,加密解密,压缩解压缩,差错控制,流量控制,路由控制,如何实现如此复杂的网络协议呢? - 通信协议分层的思想
在制定协议时,把复杂成份分解成一些简单的成份,再将它们复合起来。最常用的复合方式是层次方式,即同层间可以通信、上一层可以调用下一层,而与
再下一层不发生关系。各层互不影响,利于系统的开发和扩展。
3.3.1 TCP/IP协议簇
- 传输层协议中有两个非常重要的协议:
➢ 传输控制协议TCP(Transmission Control Protocol)
➢ 用户数据报协议UDP(User Datagram Protocol)。 - TCP/IP 以其两个主要协议:传输控制协议(TCP)和网络互联协议(IP)而得
名,实际上是一组协议,包括多个具有不同功能且互为关联的协议。 - IP(Internet Protocol)协议是网络层的主要协议,支持网间互连的数据通信。
- TCP/IP协议模型从更实用的角度出发,形成了高效的四层体系结构,即
物理链路层、IP层、传输层和应用层。
3.3.2 TCP
➢ 使用TCP协议前,须先建立TCP连接,形成传输数据通道
➢ 传输前,采用“三次握手”方式,点对点通信,是可靠的
➢ TCP协议进行通信的两个应用进程:客户端、服务端。
➢ 在连接中可进行大数据量的传输
➢ 传输完毕,需释放已建立的连接,效率低
3.3.3 UDP
➢ 将数据、源、目的封装成数据包,不需要建立连接
➢ 每个数据报的大小限制在64K内
➢ 发送不管对方是否准备好,接收方收到也不确认,故是不可靠的
➢ 可以广播发送
➢ 发送数据结束时无需释放资源,开销小,速度快
3.4 Socket
- 利用套接字(Socket)开发网络应用程序早已被广泛的采用,以至于成为事实上的标准。
- 网络上具有唯一标识的IP地址和端口号组合在一起才能构成唯一能识别的标识符套接字。
- 通信的两端都要有Socket,是两台机器间通信的端点。
- 网络通信其实就是Socket间的通信。
- Socket允许程序把网络连接当成一个流,数据在两个Socket间通过IO传输。
- 一般主动发起通信的应用程序属客户端,等待通信请求的为服务端。
- Socket分类:
➢流套接字(stream socket):使用TCP提供可依赖的字节流服务
➢数据报套接字(datagram socket):使用UDP提供“尽力而为”的数据报服务
Socket类的常用构造器:
➢ public Socket(InetAddress address,int port)创建一个流套接字并将其连接到指定IP 地址的指定端口号。
➢ public Socket(String host,int port)创建一个流套接字并将其连接到指定主机上的指定端口号。
Socket类的常用方法:
➢ public InputStream getInputStream() 返回此套接字的输入流。可以用于接收网络消息
➢ public OutputStream getOutputStream() 返回此套接字的输出流。可以用于发送网络消息
➢ public InetAddress getInetAddress() 此套接字连接到的远程 IP 地址;如果套接字是未连接的,则返回 null。
➢ public InetAddress getLocalAddress()获取套接字绑定的本地地址。 即本端的IP地址
➢ public int getPort()此套接字连接到的远程端口号;如果尚未连接套接字,则返回 0。
➢ public int getLocalPort()返回此套接字绑定到的本地端口。 如果尚未绑定套接字,则返回 -1。即本端的端口号。
➢ public void close() 关闭此套接字。套接字被关闭后,便不可在以后的网络连接中使用(即无法重新连接或重新绑定)。需要创建新的套接字对象。
关闭此套接字也将会关闭该套接字的 InputStream 和 OutputStream。
➢ public void shutdownInput()如果在套接字上调用 shutdownInput() 后从套接字输入流读取内容,则流将返回EOF(文件结束符)。
即不能在从此套接字的输入流中接收任何数据。
➢ public void shutdownOutput()禁用此套接字的输出流。对于 TCP 套接字,任何以前写入的数据都将被发 送,并且后跟 TCP 的正常连接终止序列。
如果在套接字上调用 shutdownOutput() 后写入套接字输出流,则该流将抛出 IOException。 即不能通过此套接字的输出流发送任何数据。
四、TCP网络编程
4.1 基于Socket的TCP编程
- Java语言的基于套接字编程分为服务端编程和客户端编程,其通信模型如图所示:
- 客户端Socket的工作过程
➢ 连接服务端地址
➢ 创建 Socket
➢ 打开连接到Socket 的输入/出流
➢ 按照一定的协议对Socket 进行读/写操作
➢ 关闭 Socket
public class Client {
public static void main(String[] args) throws Exception {
//连接服务端地址
InetAddress address = InetAddress.getByName("127.0.0.1");
//创建socket
Socket socket = new Socket(address, 9999);
//打开输出流
OutputStream os = socket.getOutputStream();
//发送消息
os.write("今天是个好日子".getBytes());
//关闭socket
socket.close();
}
}
- 服务器Socket的工作过程
➢ 创建一个服务器端套接字,并绑定到指定端口上 ,用于监听客户端的请求。
➢ 调用accept() 监听连接请求,该过程是个阻塞的方法,如果没有客户端连接,将一直等待
➢ 获取输出流和输入流
➢ 关闭ServerSocket和Socket对象
public class Server {
public static void main(String[] args) throws Exception {
//服务器创建一个地址
ServerSocket serverSocket = new ServerSocket(9999);
//获取客户端连接
Socket socket = serverSocket.accept();
//读取客户端消息
InputStream is = socket.getInputStream();
//管道流
ByteArrayOutputStream baos = new ByteArrayOutputStream();
byte[] buffer = new byte[1024];
int len;
while ((len = is.read(buffer)) != -1) {
baos.write(buffer, 0, len);
}
System.out.println(baos.toString());
baos.close();
socket.close();
serverSocket.close();
}
}
五、UDP网络编程
5.1 UDP网络协议
- 类 DatagramSocket 和 DatagramPacket 实现了基于 UDP 协议网络程序。
- UDP数据报通过数据报套接字 DatagramSocket 发送和接收,系统不保证UDP数据报一定能够安全送到目的地,也不能确定什么时候可以抵达。
- DatagramPacket 对象封装了UDP数据报,在数据报中包含了发送端的IP地址和端口号以及接收端的IP地址和端口号。
- UDP协议中每个数据报都给出了完整的地址信息,因此无须建立发送方和接收方的连接。
UDP网络通信流程
➢ 建立发送端,接收端
➢ 建立数据包
➢ 调用Socket的发送、接收方法
➢ 关闭Socket
发送端
public class UdpSend {
public static void main(String[] args) throws IOException {
//建立一个socket
DatagramSocket socket = new DatagramSocket();
//创建数据包
InetAddress address = InetAddress.getByName("localhost");
String msg = "你好,服务器";
DatagramPacket packet = new DatagramPacket(msg.getBytes(),0,msg.getBytes().length,address,9000);
//发送数据
socket.send(packet);
//关闭连接
socket.close();
}
}
接收端
public class UdpReceive {
public static void main(String[] args) throws IOException {
//开放端口
DatagramSocket socket = new DatagramSocket(9000);
//接收数据包
byte[] buffer = new byte[1024];
DatagramPacket packet = new DatagramPacket(buffer,0,buffer.length);
socket.receive(packet);
System.out.println(new String(packet.getData()));
//关闭连接
socket.close();
}
}
模拟循环发送和接收消息
public class Receive {
public static void main(String[] args) throws IOException {
//创建socket连接
DatagramSocket socket = new DatagramSocket(9000);
while(true) {
//接收数据包
byte[] buffer = new byte[1024];
DatagramPacket packet = new DatagramPacket(buffer,0,buffer.length);
socket.receive(packet);
byte[] data = packet.getData();
String datas = new String(data,0,packet.getLength());
System.out.println(datas);
// datas.trim().equals("bye")
if(datas.equals("bye")) {
socket.close();
break;
}
}
}
}
public class Send {
public static void main(String[] args) throws IOException {
//创建socket
DatagramSocket socket = new DatagramSocket(8000);
while(true) {
//从控制台读取数据
BufferedReader reader = new BufferedReader(new InputStreamReader(System.in));
byte[] bytes = reader.readLine().getBytes();
//创建数据包
DatagramPacket packet = new DatagramPacket(bytes, 0, bytes.length, new InetSocketAddress("localhost",9000));
socket.send(packet);
if(new String(bytes).equals("bye")) {
socket.close();
reader.close();
break;
}
}
}
}
注意
此处存在一个问题: DatagramPacket.getData().length与DatagramPacket.getLength()长度不相等?
getLength()反映了刚刚接收到的数据的长度,而getData()反映了DatagramPacket对应缓冲区中的新接收到的数据和未被覆盖的旧数据,当我们使用DatagramPacket来处理新接收到的数据时,就容易同时触及到旧数据导致混乱。
这个问题我们会在另一篇博客中详细分析
多线程模拟网页中的咨询
接收方
public class TalkReceive implements Runnable {
DatagramSocket socket;
private String msgFrom;
public TalkReceive(int port, String msgFrom) throws SocketException {
this.msgFrom = msgFrom;
socket = new DatagramSocket(port);
}
@Override
public void run() {
try {
while (true) {
byte[] buffer = new byte[1024];
DatagramPacket packet = new DatagramPacket(buffer, 0, buffer.length);
socket.receive(packet);
byte[] data = packet.getData();
String datas = new String(data, 0, packet.getLength());
System.out.println(this.msgFrom + ":" + datas);
if (datas.equals("bye")) {
socket.close();
break;
}
}
} catch (Exception e) {
e.printStackTrace();
}
}
}
发送方
public class TalkSend implements Runnable {
DatagramSocket socket;
BufferedReader reader;
private String toIp;
private int toPort;
public TalkSend(int fromPort, String toIp, int toPort) throws SocketException {
this.toIp = toIp;
this.toPort = toPort;
socket = new DatagramSocket(fromPort);
reader = new BufferedReader(new InputStreamReader(System.in));
}
@Override
public void run() {
try {
while(true) {
//从控制台读取信息
byte[] bytes = reader.readLine().getBytes();
//创建数据包
DatagramPacket packet = new DatagramPacket(bytes, 0, bytes.length, new InetSocketAddress(this.toIp, this.toPort));
socket.send(packet);
//退出循环
if (new String(bytes).equals("bye")) {
socket.close();
reader.close();
break;
}
}
} catch (IOException e) {
e.printStackTrace();
}
}
}
启动类
public class TalkTeacher {
public static void main(String[] args) throws SocketException {
String host = "localhost";
new Thread(new TalkSend(9999,host,8888)).start();
new Thread(new TalkReceive(9000,"学生")).start();
}
}
public class TalkStudent {
public static void main(String[] args) throws SocketException {
String host = "localhost";
//开启两个线程,既可以发送又可以接收
new Thread(new TalkSend(8000,host,9000)).start();
new Thread(new TalkReceive(8888,"老师")).start();
}
}
六、URL编程
6.1 URL
- URL(Uniform Resource Locator) Locator):统一资源定位符,它表示 Internet上某一资源的地址。
- 它是一种具体的URI,即URL可以用来标识一个资源,而且还指明了如何locate这个资源。
- URL的基本结构由5部分组成:
<传输协议>://<主机名>:<端口号>/<项目名>/<文件名>#片段名?参数列表
➢ 例如: http://192.168.1.100:8080/helloworld/index.jsp#a?username=shkstart&password=123
➢ 片段名:即锚点,例如看小说,直接定位到章节
➢ 参数列表格式:参数名=参数值&参数名=参数值…
URL 对象的构造器:
➢public URL (String spec)
通过一个表示URL地址的字符串可以构造一个URL对象。例如:URL url = new URL (“http://www. atguigu.com/”);
➢public URL(URL context, String spec ))
通过基 URL 和相对 URL 构造 一 个 URL 对象 。
例如 URL downloadUrl = new URL(url ,“download.html”);
➢public URL(String protocol, String host, String file)
例如 new URL(“http”,www.atguigu.com “, “download. html”);
➢public URL(String protocol, String host, int port, String file)
例如 : URL gamelan = new
URL(“http”, "www.atguigu.com ", 80, “download.html”);
- URL类的构造器都声明抛出非运行时异常,必须要对这一异常进行处理,通常是用 try-catch语句进行捕获。
一个URL对象生成后,其属性是不能被改变的,但可以通过它给定的方法来获取这些属性:
➢ public String getProtocol( )
获取该URL的协议名
➢ public String getHost( )
获取该URL的主机名
➢ public String getPort( )
获取该URL的端口号
➢ public String getPath( )
获取该URL的文件路径
➢ public String getFile( )
获取该URL的文件名
➢ public String getQuery( )
获取该URL的查询名
6.2 URLConnection
-
URL的方法 openStream():能从网络上读取数据
-
若希望输出数据,例如向服务器端的 CGI (公共网关接口-Common Gateway Interface-的简称,是用户浏览器和服务器端的应用程序进行连接的接口)程序发送一些数据,则必须先与URL建立连接,然后才能对其进行读写,此时需要使用 URLConnection 。
-
URLConnection:表示到URL所引用的远程对象的连接。当与一个URL建立连接时,首先要在一个 URL 对象上通过方法 openConnection() 生成对应的 URLConnection对象。如果连接过程失败,将产生IOException.
➢URL netchinaren = new URL (“http://www.atguigu.com/index.shtml”);
➢URLConnectonn u = netchinaren.openConnection( ); -
通过URLConnection对象获取的输入流和输出流,即可以与现有的CGI程序进行交互。
➢ public Object getContent( ) throws IOException
➢ public int getContentLength( )
➢ public String getContentType( )
➢ public long getDate( )
➢ public long getLastModified( )
➢ public InputStream getInputStream( )throws IOException
➢ public OutputSteram getOutputStream( )throws IOException
URI、URL和URN的区别
➢ URI是uniform resource identifier,统一资源标识符
,用来唯一的标识一个资源。
➢ URL是uniform resource locator,统一资源定位符
,它是一种具体的URI,即URL可以用来标识一个资源,而且还指明了如何locate这个资源。
➢ URN,uniform resource name,统一资源命名
,是通过名字来标识资源,比如mailto:java-net@java.sun.com。也就是说,URI是以一种抽象的,高层次概念定义统一资源标识,而URL和URN则是具体的资源标识的方式。URL和URN都是一种URI。
在Java的URI中,一个URI实例可以代表绝对的,也可以是相对的,只要它符合URI的语法规则。而URL类则不仅符合语义,还包含了定位该资源的信息,因此它不能是相对的。
下载网络资源
public class TestUrl {
public static void main(String[] args) throws IOException {
//初始化下载地址
URL url = new URL("https://img-blog.csdnimg.cn/20190412201818706.PNG?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQxODI4NjAz,size_16,color_FFFFFF,t_70");
//连接到这个资源
HttpURLConnection urlConnection = (HttpURLConnection) url.openConnection();
InputStream is = urlConnection.getInputStream();
FileOutputStream fos = new FileOutputStream("2.jpg");
//下载
byte[] buffer = new byte[1024];
int len;
while((len = is.read(buffer))!=-1) {
fos.write(buffer,0,len);
}
//关闭资源
fos.close();
urlConnection.disconnect();
}
}
七、总结
- 位于网络中的计算机具有唯一的IP地址,这样不同的主机可以互相区分。
- 客户端-服务器是一种最常见的网络应用程序模型。服务器是一个为其客户端提供某种特定服务的硬件或软件。客户机是一个用户应用程序,用于访问某台服务器提供的服务。端口号是对一个服务的访问场所,它用于区分同一物理计算机上的多个服务。套接字用于连接客户端和服务器,客户端和服务器之间的每个通信会话使用一个不同的套接字。TCP协议用于实现面向连接的会话。
- Java 中有关网络方面的功能都定义在 java.net 程序包中。Java 用 InetAddress 对象表示 IP地址,该对象里有两个字段:主机名(String) 和 IP 地址(int)。
- 类 Socket 和 ServerSocket
实现了基于TCP协议的客户端-服务器程序。Socket是客户端和服务器之间的一个连接,连接创建的细节被隐藏了。这个连接提供了一个安全的数据传输通道,这是因为 TCP 协议可以解决数据在传送过程中的丢失、损坏、重复、乱序以及网络拥挤等问题,它保证数据可靠的传送。 - 类 URL 和 URLConnection 提供了最高级网络应用。URL 的网络资源的位置来同一表示 Internet 上各种网络资源。通过URL对象可以创建当前应用程序和 URL 表示的网络资源之间的连接,这样当前程序就可以读取网络资源数据,或者把自己的数据传送到网络上去。