2022.02.09_Java学习总结_网络编程、正则表达式

1. 网络编程

1.1 概述

JavaInternet 上的语言,它从语言级上提供了对网络应用程序的支持,程序员能够很容易开发常见的网络应用程序。
Java提供的网络类库,可以实现无痛的网络连接,联网的底层细节被隐藏在 Java 的本机安装系统里,由 JVM 进行控制。并且 Java 实现了一个跨平台的网络库,程序员面对的是一个统一的网络编程环境。

1.2 网络基础

	计算机网络:
	把分布在不同地理区域的计算机与专门的外部设备用通信线路互连成一个规 模大、功能强的网络系统,从而使众多的计算机可以方便地互相传递信息、 共享硬件、软件、数据信息等资源。
	网络编程的目的:
	直接或间接地通过网络协议与其它计算机实现数据交换,进行通讯。
	网络编程中有两个主要的问题:
		如何准确地定位网络上一台或多台主机;定位主机上的特定的应用
		找到主机后如何可靠高效地进行数据传输

1.3 网络通信

通信双方地址
a)	IP
b)	端口号
一定的规则(即:网络通信协议。有两套参考模型)
c)	OSI参考模型:模型过于理想化,未能在因特网上进行广泛推广
d)	TCP/IP参考模型(或TCP/IP协议):事实上的国际标准。

1.3.1 IP

	IP 地址:InetAddress
	唯一的标识 Internet 上的计算机(通信实体)
	本地回环地址(hostAddress)127.0.0.1	主机名(hostName):localhost
	IP地址分类方式1:IPV4 和 IPV6
		IPV4:4个字节组成,40-255。大概42亿,30亿都在北美,亚洲4亿。2011年初已经用尽。以点分十进制表示,如192.168.0.1
		IPV6:128位(16个字节),写成8个无符号整数,每个整数用四个十六进制位表示, 数之间用冒号(:)分开,如:3ffe:3201:1401:1280:c8ff:fe4d:db39:1984
	IP地址分类方式2:公网地址(万维网使用)和私有地址(局域网使用)192.168.  开头的就是私有址址,范围即为192.168.0.0--192.168.255.255,专门为组织机 构内部使用
	特点:不易记忆

1.3.2 端口

	端口号标识正在计算机上运行的进程(程序)
		不同的进程有不同的端口号
		被规定为一个 16 位的整数 0~65535。
		端口分类:
			公认端口:0~1023。被预先定义的服务通信占用(如:HTTP占用端口80,FTP占用端口21Telnet占用端口23)
			注册端口:1024~49151。分配给用户进程或应用程序。(如:Tomcat占用端口8080MySQL占用端口3306Oracle占用端口1521等)。
			动态/私有端口:49152~65535。
	端口号与IP地址的组合得出一个网络套接字:Socket

1.4 OSI七层

应用层,表示层,会话层,传输层,数据链路层,物理层,网络层


应用层 : 在网络中向用户提供服务窗口,主要用来支持用户的需求
电子邮件,文件传输等
主要协议 : http(80),DNS,FTP(21)

表示层 : 为通信提供一种公共的语言,方便交互,因为计算机系统结构不同,数据表示方式也就不同
其他功能 可以做数据加密,数据压缩等

传输层 : 两台计算机经过网络进行数据通信
协议有 TCP/UDP
数据链路层 : 可以理解为数据通道
MAC地址表示唯一性

网络层 : 以IP报文的形式进行传递,并且在网络层IP地址表示唯一性

1.5 网络协议

1.5.1 TCP/IP

1.5.1.1 概述
	传输层协议中有两个非常重要的协议:
		传输控制协议TCP(Transmission Control Protocol)
		用户数据报协议UDP(User Datagram Protocol)。
	TCP/IP 以其两个主要协议:传输控制协议(TCP)和网络互联协议(IP)而得名,实际上是一组协议,包括多个具有不同功能且互为关联的协议。
	IP(Internet Protocol)协议是网络层的主要协议,支持网间互连的数据通信。
	TCP/IP协议模型从更实用的角度出发,形成了高效的四层体系结构,即物理链路层、IP层、传输层和应用层。

在这里插入图片描述

 * 网络架构 : B/S C/S
 * 
 * B/S : Browser/Server 基于浏览器的服务器应用,比如网页版淘宝
 * 
 * C/S : Client/Server 基于客户端的服务器应用,比如安装的淘宝APP
 * 
 * TCP : 能重传,不丢包,如果丢失的话,会记录下来,重新发送,但是不会重复发送 可靠, 有序 ;
 * 保证顺序不会乱,比如发送123,2丢失了会重传,接收到的就成了132,但是 你看到的一定是123 面向连接 : 如果连接不上,数据不会发送,简称三次握手
 * 类似于打电话,如果打不通,消息是传递不过去的
 * 
 * UDP : 速度快,不保证可靠,可能丢包,无连接,相当于发短信
1.5.1.2 Socket
	利用套接字(Socket)开发网络应用程序早已被广泛的采用,以至于成为事实 上的标准。
	网络上具有唯一标识的IP地址和端口号组合在一起才能构成唯一能识别的标 识符套接字。
	通信的两端都要有Socket,是两台机器间通信的端点。
	网络通信其实就是Socket间的通信。
	Socket允许程序把网络连接当成一个流,数据在两个Socket间通过IO传输。
	一般主动发起通信的应用程序属客户端,等待通信请求的为服务端。
	Socket分类:
		流套接字(stream socket):使用TCP提供可依赖的字节流服务数据报套接字(datagram socket):使用UDP提供“尽力而为”的数据报服务

1.5.1.3 常用方法
Socket类的常用构造器:
		public Socket(InetAddress address,int port)创建一个流套接字并将其连接到指定IP 地址的指定端口号。
		public Socket(String host,int port)创建一个流套接字并将其连接到指定主机上的指定端口号。
	Socket类的常用方法:
		public InputStream getInputStream()返回此套接字的输入流。可以用于接收网络消息
		public OutputStream getOutputStream()返回此套接字的输出流。可以用于发送网络消息
		public InetAddress getInetAddress()此套接字连接到的远程 IP 地址;如果套接字是未连接的,则返回 null。
		public InetAddress getLocalAddress()获取套接字绑定的本地地址。 即本端的IP地址
		public int getPort()此套接字连接到的远程端口号;如果尚未连接套接字,则返回 0。
		public int getLocalPort()返回此套接字绑定到的本地端口。 如果尚未绑定套接字,则返回 -1。即本端的 端口号。
		public void close()关闭此套接字。套接字被关闭后,便不可在以后的网络连接中使用(即无法重新连接 或重新绑定)。需要创建新的套接字对象。 关闭此套接字也将会关闭该套接字的 InputStreamOutputStream。
		public void shutdownInput()如果在套接字上调用 shutdownInput() 后从套接字输入流读取内容,则流将 返回EOF(文件结束符)。 即不能在从此套接字的输入流中接收任何数据。
		public void shutdownOutput()禁用此套接字的输出流。对于 TCP 套接字,任何以前写入的数据都将被发 送,并且后跟 TCP 的正常连接终止序列。 如果在套接字上调用 shutdownOutput() 后写入套接字输出流,  则该流将抛出 IOException。 即不能通过此套接字的输出流发送任何数据。

1.5.1.4 服务端
		// 创建对象,支持TCP协议.并开启端口号
		ServerSocket ss = new ServerSocket(10000);
		System.out.println("服务器已经启动,等待客户端连接....");
		// 执行该方法的时候,线程就停下来了,等待客户端连接
		// 只要有客户端连接,就会返回socket对象,里面封装的是客户端的信息
		Socket skt = ss.accept();
		System.out.println("客户端已连接");
		// 获取客户端信息
		// 获取客户端对应的输入流
		InputStream is = skt.getInputStream();
		BufferedReader br = new BufferedReader(new InputStreamReader(is,"UTF-8"));
		// 给客户端发送数据
		// 获取客户端对应的输出流
		OutputStream os = skt.getOutputStream();
		PrintWriter pw = new PrintWriter(new OutputStreamWriter(os,"UTF-8"));
		// 接收用户输入
		Scanner scanner = new Scanner(System.in);
		String msg = null;
		boolean flag = true;
		while (flag) {
			// 读取数据
			String line = br.readLine();
			System.out.println("客户端发来消息 : " + line);
			msg = scanner.nextLine();
			if (msg.equals("exit")) {
				flag=false;
			}
			// 给客户端发送数据
			pw.println(msg);
			pw.flush();
		}
		// 关闭资源
		br.close();
		pw.close();
		skt.close();
		ss.close();
		System.out.println("已断开连接");
	

1.5.1.5 客户端
		// 客户端对象,指定服务端IP和端口
		Socket skt = new Socket("127.0.0.1", 10000);
		// 获取客户端信息
		// 获取客户端对应的输入流
		InputStream is = skt.getInputStream();
		BufferedReader br = new BufferedReader(new InputStreamReader(is,"UTF-8"));
		// 给服务端发送数据
		// 获取服务端对应的输出流
		OutputStream os = skt.getOutputStream();
		PrintWriter pw = new PrintWriter(new OutputStreamWriter(os,"UTF-8"));
		// 接收用户输入
		Scanner scanner = new Scanner(System.in);
		String msg = null;
		boolean flag = true;
		while (flag) {
			// 给服务端发送数据
			pw.println(msg);
			pw.flush();
			msg = scanner.nextLine();
			if (msg.equals("exit")) {
				flag = false;
			}
			// 读取数据
			String line = br.readLine();
			System.out.println("服务端发来消息 : " + line);
		}
		// 关闭资源
		br.close();
		pw.close();
		skt.close();

1.5.2 UDP/IP

1.5.2.1 概述
类 DatagramSocketDatagramPacket 实现了基于 UDP 协议网络程序。
UDP数据报通过数据报套接字 DatagramSocket 发送和接收,系统不保证UDP数据报一定能够安全送到目的地,也不能确定什么时候可以抵达。
DatagramPacket 对象封装了UDP数据报,在数据报中包含了发送端的IP  地址和端口号以及接收端的IP地址和端口号。
UDP协议中每个数据报都给出了完整的地址信息,因此无须建立发送方和 接收方的连接。如同发快递包裹一样。
DatagramSocket 类的常用方法
public DatagramSocket(int port)创建数据报套接字并将其绑定到本地主机上的指定端口。套接字将被绑定到通配符地址,IP 地址由内核来选择。
public DatagramSocket(int port,InetAddress laddr)创建数据报套接字,将其绑定到指定的本地地址。 本地端口必须在 065535 之间(包括两者)。如果 IP 地址为 0.0.0.0,套接字将被绑定到通配符地 址,IP 地址由内核选择。
public void close()关闭此数据报套接字。
public void send(DatagramPacket p)从此套接字发送数据报包。DatagramPacket 包含的信息指示:将要发送的数据、其长度、远程主机的 IP 地址和远程主机的端口号。
public void receive(DatagramPacket p)从此套接字接收数据报包。当此方法返回时,DatagramPacket  的缓冲区填充了接收的数据。数据报包也包含发送方的 IP 地址和发送方机器上的端口号。 此方法 在接收到数据报前一直阻塞。数据报包对象的 length 字段包含所接收信息的长度。如果信息比包的 长度长,该信息将被截短。
public InetAddress getLocalAddress()获取套接字绑定的本地地址。
public int getLocalPort()返回此套接字绑定的本地主机上的端口号。
public InetAddress getInetAddress()返回此套接字连接的地址。如果套接字未连接,则返回null。
public int getPort()返回此套接字的端口。如果套接字未连接,则返回 -1DatagramPacket类的常用方法
public DatagramPacket(byte[] buf,int length)构造 DatagramPacket,用来接收长
度为length 的数据包。 length 参数必须小于等于 buf.length。
public DatagramPacket(byte[] buf,int length,InetAddress address,int port)构造数 据报包,用来将长度为 length 的包发送到指定主机上的指定端口号。length  参数必须小于等于buf.length。
public InetAddress getAddress()返回某台机器的 IP 地址,此数据报将要发往该
机器或者是从该机器接收到的。
public int getPort()返回某台远程主机的端口号,此数据报将要发往该主机或 者是从该主机接收到的。
public byte[] getData()返回数据缓冲区。接收到的或将要发送的数据从缓冲区
中的偏移量 offset 处开始,持续length 长度。
public int getLength()返回将要发送或接收到的数据的长度。
UDP网络通信
流 程:
1.DatagramSocket与DatagramPacket
2.建立发送端,接收端
3.建立数据包
4.调用Socket的发送、接收方法
5.关闭Socket
发送端与接收端是两个独立的运行程序

1.5.2.2 服务端

	public static void main(String[] args) throws Exception {
		// 打开UDP对象,并监听某个端口,用于接收数据
		DatagramSocket ds = new DatagramSocket(10000);
		// 创建字节数组,用于保存接收到的数据
		byte[] buf = new byte[1024];
		// 声明一个包接收器
		DatagramPacket dp = new DatagramPacket(buf, buf.length);
		
		while (true) {
			// 通过开启的端口接收数据
			ds.receive(dp);
			
			ByteArrayInputStream bais = new ByteArrayInputStream(buf);
			DataInputStream dis = new DataInputStream(bais);
			System.out.println(dis.readUTF());
		}
	}

1.5.2.3 客户端

			Scanner scanner = new Scanner(System.in);
					// 要发送的数据
			String string = scanner.nextLine();
			// 创建字节数组输出流
			ByteArrayOutputStream baos = new ByteArrayOutputStream();
			// 创建数据流
			DataOutputStream dos = new DataOutputStream(baos);
			// 写出数据,把数据写到字节数组流中,同时保存了数据类型
			dos.writeUTF(string);
			// 把数据转换为字节数组
			byte[] buf = baos.toByteArray();
			//System.out.println(new String(buf));
			
			// 数据传输
			// 创建数据包,把数据进行打包
			// 并绑定服务端地址和端口
			DatagramPacket dp = new DatagramPacket(buf, buf.length,new InetSocketAddress("127.0.0.1", 10000));
			
			// 传输,需要本地开启端口把数据发送出去
			DatagramSocket ds = new DatagramSocket(9999);
			// 发送数据包
			ds.send(dp);
			// 关闭资源
			ds.close();
			System.out.println("发送完成");
		

2. 正则表达式

2.1 概述

 * 正则表达式 定义了字符串的模式,可以用来搜索,编辑,处理文本,并不仅限于某一种语言
 * 
 * 但是在每种语言中也会有细微的差别
 * 
 * jdk1.4推出正则表达式, 保存在java.util.regex包下

2.2 语法

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

Java 源代码的字符串中的反斜线被解释为 Unicode 转义或其他字符转义。因此必须在字符串字面值中使用两个反斜线,表示正则表达式受到保护,不被 Java 字节码编译器解释。例如,当解释为正则表达式时,字符串字面值 "\b" 与单个退格字符匹配,而 "\\b" 与单词边界匹配。字符串字面值 "\(hello\)" 是非法的,将导致编译时错误;要与字符串 (hello) 匹配,必须使用字符串字面值 "\\(hello\\)"(),[],{}的区别
1>. 小括号():匹配小括号内的字符串,可以是一个,也可以是多个,常跟“|”(或)符号搭配使用,是多选结构的
  示例1:string name = "way2014";  regex:(way|zgw)  result:结果是可以匹配出way的,因为是多选结构,小括号是匹配字符串的
  示例2:string text = "123456789";  regex:(0-9) result:结果是什么都匹配不到的,它只匹配字符串"0-9"而不是匹配数字, [0-9]这个字符组才是匹配0-9的数字
2>.中括号[]:匹配字符组内的字符,比如咱们常用的[0-9a-zA-Z.*?!]等,在[]内的字符都是字符,不是元字符,比如“0-9”、“a-z”这中间的“-”就是连接符号,表示范围的元字符,如果写成[-!?*(]这样的话,就是普通字符
  示例1: string text = "1234567890";  regex:[0-9]  result:结果是可以匹配出字符串text内的任意数字了,像上边的【或符号“|”在字符组内就是一个普通字符】
  示例2:string text = "a|e|s|v";  regex:[a|e|s]  result:结果就是匹配字符a、e、s三个字符,这个跟(a|e|s)有区别的,区别就是(a|e|s)匹配的是a、e、s三个字符的随意一个,三个 中的任意一个,这里|是元字符
3>.大括号{}:匹配次数,匹配在它之前表达式匹配出来的元素出现的次数,{n}出现n次、{n,}匹配最少出现n次、{n,m}匹配最少出现n次,最多出现m次

 * 正则表达式常用语法 : 
 *		\ : 转移符,把有意义字符转换为无意义字符
 *	范围相关
 *		[abc] : 可能是a,可能是b,也可能是c    
 *		[a-z] : 可以匹配到小写字母
 *		[A-Za-z] : 可以匹配到大小写字母
 *		[A-Za-z0-9] : 大小写字母和数字
 *		[0-9] : 匹配数字   
 *		[^0-9] : 匹配不是数字
 *	简洁表示方式
 *		. : 匹配任意字符,如果想匹配 .  需要转义 \.
 *	 \d : 表示数字  等价于 [0-9]
 *	  \D : 并表示非数字 [^0-9]
 *		\s : 表示由空字符组成
 *		\S : 表示非空
 *		\w : 表示字母,数字,下划线 [0-9a-zA-Z_]
 *		\W : 表示非字母数字下划线
 * 数量相关 : 
 * 		? : 表示出现0次或1* 		+ : 表示出现1次或多次,大于等于1
 * 		* : 大于等于0
 * 		{n} : 表示出现n次 , [0-9]{6} : 表示出现6位数字
 * 		{n,} : 表示出现n次或n次以上 , 就是大于等于n , \d{6,} : 表示出现至少6个数字
 * 		{n,m} : 表示出现n到m次 , \d{6,9} : 表示出现69个数字
 * 
 * 		| :, x|y 表示出现x或者是y
 * 		() : 子表达式,看做一个整体
 * 				([0-9]){5}

2.3 Java中的正则表达式

java.util.regex包
PatternSyntaxException 是一个非强制异常类,它表示一个正则表达式模式中的语法错误

2.3.1 Pattern

	用于创建一个正则表达式,也可以说创建一个匹配模式,它的构造方法是私有的,不可以直接创建
	可以通过Pattern.complie(String regex)创建一个正则表达式
	只能做一些简单的匹配操作

使用:
Pattern.split(CharSequence input) ,成员方法, 用于分隔字符串

import java.util.regex.*;
public class TestRegex
{
    public static void main(String[] args)
    {
        String input="001_天亮_教育_石家庄";
        Pattern pattern=Pattern.compile("_");
        String[] strArray=pattern.split(input);
        for(String ele:strArray){
            System.out.println(ele);
        }
    }
}

Pattern.matches (String regex,CharSequence input),静态方法,用于快速匹配字符串,该方法适合用于只匹配一次,且匹配全部字符串。
	// 匹配
	public  static void test2(){
		// 内容
		String str = "23.456";
		// 正则表达式
		String regex = "\\d+(\\.\\d+)?";
		// 创建引擎对象
		Pattern pattern = Pattern.compile(regex);
		// 匹配 , 并且是全词匹配
		boolean result = pattern.matches(regex, str);
		System.out.println(result);
	}
	// 拆分
	public static void test1(){
		String string = "1.2.3.4.5";
		// 创建正则表达式引擎对象
		// 注意,所有以 . 进行操作的 都要转义,而在java中 使用正则表达式的转移符 要写两个
		// 因为在java中\ 也是转移符
		Pattern pattern = Pattern.compile("\\.");
		// 调用拆分方法
		String[] arr = pattern.split(string);
		for (String string2 : arr) {
			System.out.println(string2);
		}

2.3.2 Matcher

	构造方法也是私有的,不能随意创建,只能通过Pattern.matcher(CharSequence input)方法得到该类的实例 Matcher m = p.matcher("aaaaab");
	支持便捷强大的正则匹配操作,包括分组、多次匹配支持

2.3.2.1 字符串匹配
Matcher.matches():对整个字符串进行匹配,只有整个字符串都匹配了才返回true
Matcher.lookingAt():对前面的字符串进行匹配,只有匹配到的字符串在最前面才返回true
Matcher.find():对字符串进行匹配,匹配到的字符串可以在任何位置

	// 1 matches : 全词匹配
	public static void test1() {
		String input = "13113113111";
		String regex = "\\d{11}";

		// 创建正则表达式引擎对象
		Pattern pattern = Pattern.compile(regex);
		// 创建匹配器
		Matcher matcher = pattern.matcher(input);
		// 匹配
		boolean result = matcher.matches();
		System.out.println(result);
	}

	// 2 lookingAt : 从前往后匹配,前面符合条件就行
	public static void test2() {
		String input = "13113113111asd";
		String regex = "\\d{11}";

		// 创建正则表达式引擎对象
		Pattern pattern = Pattern.compile(regex);
		// 创建匹配器
		Matcher matcher = pattern.matcher(input);
		// 匹配
		boolean result = matcher.lookingAt();
		System.out.println(result);
	}

	// 3 find : 任意位置符合条件都可以
	public static void test3() {
		String input = "asd13113113111asd";
		String regex = "\\d{11}";

		// 创建正则表达式引擎对象
		Pattern pattern = Pattern.compile(regex);
		// 创建匹配器
		Matcher matcher = pattern.matcher(input);
		// 匹配
		boolean result = matcher.find();
		System.out.println(result);
	}

2.3.2.2 数据提取
	// 4 group : find和group一起使用,可以做到数据提取
	public static void test4() {
		String input = "张小三的电话号码是13113113111s@##李四的电话号码是13113113112王五的电话号码是13113113113";
		// [\u4E00-\u9FFF] 汉字范围
		String regex = "([\u4E00-\u9FFF]{2,3})的电话号码是(\\d{11})";

		// 创建正则表达式引擎对象
		Pattern pattern = Pattern.compile(regex);
		// 创建匹配器
		Matcher matcher = pattern.matcher(input);
		// 匹配
		while (matcher.find()) {
			// group() 和 group(0) 都是提取匹配到的数据
			// 1 就是第一组数据(第一个小括号) , 2 就是第二组数据
			// System.out.println(matcher.group());
			// System.out.println(matcher.group(0));
			System.out.println(matcher.group(1)+" : "+matcher.group(2));
		}
	}

2.3.2.3 叠词去重
		// 还原成 : 我要学编程
		String input = "我我...我我...我要..要要...要要...学学学....学学...编编编..编程..程.程程...程...程";
		// 1 把.去掉
		input = input.replaceAll("[^\u4E00-\u9FFF]", "");
		// 我我我我我要要要要要学学学学学编编编编程程程程程程
		System.out.println(input);

		// (.) : 任意字符组成
		// \\1 获取前面组中的数据
		// (\\d)\\1 : 表示两个连续出现的数字, 比如 11,22,33,44
		// (\\d)(a)\\1 : 表示 第一个和第三个是相同的数字,且数字中间有个a ,1a1,9a9
		// (\\d)(a)\\2 : 表示 第一个是数字,第二个和第三个都是a,1aa,3aa
		String regex = "(.)(\\1+)";

		// 创建正则表达式引擎对象
		Pattern pattern = Pattern.compile(regex);
		// 创建匹配器
		Matcher matcher = pattern.matcher(input);
		// find查找
		// while (matcher.find()) {
		// // 使用 group(1)把group(0) 替换即可
		// input = input.replaceAll(matcher.group(), matcher.group(1));
		// }

		// $1 就是 group(1) 而 regex 就等于是group();
		input = input.replaceAll(regex, "$1");
		System.out.println(input);
	

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值