1.3 正则表达式规则匹配练习
syso alt+/
1.1 正则表达式的概念
正则表达式(英语:Regular Expression,在代码中常简写为regex)。
正则表达式是一个字符串,使用单个字符串来描述、用来定义匹配规则,匹配一系列符合某个句法规则的字符串。在开发中,正则表达式通常被用来检索、替换那些符合某个规则的文本。
1.2 正则表达式的匹配规则
参照帮助文档,在Pattern类中有正则表达式的的规则定义,正则表达式中明确区分大小写字母。我们来学习语法规则。
正则表达式的语法规则:
字符:x
含义:代表的是字符x
例如:匹配规则为 “a”,那么需要匹配的字符串内容就是 ”a”
字符:\\ 翻译:将转义字符转义为普通斜线,失去了转义字符的意思
含义:代表的是反斜线字符'\'
例如:匹配规则为"\\" ,那么需要匹配的字符串内容就是 ”\”
字符:\t
含义:制表符
例如:匹配规则为"\t" ,那么对应的效果就是产生一个制表符的空间
字符:\n
含义:换行符
例如:匹配规则为"\n",那么对应的效果就是换行,光标在原有位置的下一行
字符:\r
含义:回车符
例如:匹配规则为"\r" ,那么对应的效果就是回车后的效果,光标来到下一行行首
字符类:[abc]
含义:代表的是字符a、b 或 c
例如:匹配规则为"[abc]" ,那么需要匹配的内容就是字符a,或者字符b,或字符c的一个
字符类:[^abc]
含义:代表的是除了 a、b 或 c以外的任何字符
例如:匹配规则为"[^abc]",那么需要匹配的内容就是不是字符a,或者不是字符b,或不是字符c的任意一个字符
字符类:[a-zA-Z]
含义:代表的是a 到 z 或 A 到 Z,两头的字母包括在内
例如:匹配规则为"[a-zA-Z]",那么需要匹配的是一个大写或者小写字母
字符类:[0-9]
含义:代表的是 0到9数字,两头的数字包括在内
例如:匹配规则为"[0-9]",那么需要匹配的是一个数字
字符类:[a-zA-Z_0-9]
含义:代表的字母或者数字或者下划线(即单词字符)
例如:匹配规则为" [a-zA-Z_0-9] ",那么需要匹配的是一个字母或者是一个数字或一个下滑线
预定义字符类:.
含义:代表的是任何字符
例如:匹配规则为" . ",那么需要匹配的是一个任意字符。如果,就想使用 . 的话,使用匹配规则"\\."来实现
预定义字符类:\d
含义:代表的是 0到9数字,两头的数字包括在内,相当于[0-9]
例如:匹配规则为"\d ",那么需要匹配的是一个数字
预定义字符类:\w
含义:代表的字母或者数字或者下划线(即单词字符),相当于[a-zA-Z_0-9]
例如:匹配规则为"\w ",,那么需要匹配的是一个字母或者是一个数字或一个下滑线
边界匹配器:^
含义:代表的是行的开头
例如:匹配规则为^[abc][0-9]$ ,那么需要匹配的内容从[abc]这个位置开始, 相当于左双引号
边界匹配器:$
含义:代表的是行的结尾
例如:匹配规则为^[abc][0-9]$ ,那么需要匹配的内容以[0-9]这个结束, 相当于右双引号
边界匹配器:\b
含义:代表的是单词边界
例如:匹配规则为"\b[abc]\b" ,那么代表的是字母a或b或c的左右两边需要的是非单词字符([a-zA-Z_0-9])
数量词:X?
含义:代表的是X出现一次或一次也没有
例如:匹配规则为"a?",那么需要匹配的内容是一个字符a,或者一个a都没有
数量词:X*
含义:代表的是X出现零次或多次
例如:匹配规则为"a*" ,那么需要匹配的内容是多个字符a,或者一个a都没有
数量词:X+
含义:代表的是X出现一次或多次
例如:匹配规则为"a+",那么需要匹配的内容是多个字符a,或者一个a
数量词:X{n}
含义:代表的是X出现恰好 n 次
例如:匹配规则为"a{5}",那么需要匹配的内容是5个字符a
数量词:X{n,}
含义:代表的是X出现至少 n 次
例如:匹配规则为"a{5, }",那么需要匹配的内容是最少有5个字符a
数量词:X{n,m}
含义:代表的是X出现至少 n 次,但是不超过 m 次
例如:匹配规则为"a{5,8}",那么需要匹配的内容是有5个字符a 到 8个字符a之间
1.3 正则表达式规则匹配练习
请写出满足如下匹配规则的字符串:
规则:"[0-9]{6,12}"
该规则需要匹配的内容是:长度为6位到12位的数字。
如:使用数据"123456789"进行匹配结果为true;
使用数据"12345"进行匹配结果为false。
规则:“1[34578][0-9]{9}”
该规则需要匹配的内容是:11位的手机号码,第1位为1,第2位为3、4、5、7、8中的一个,后面9位为0到9之间的任意数字。
如:使用数据"12345678901"进行匹配结果为false;
使用数据"13312345678"进行匹配结果为true。
规则:“a*b”
该规则需要匹配的内容是:在多个a或零个a后面有个b;b必须为最后一个字符。
如:使用数据"aaaaab"进行匹配结果为true;
使用数据"abc"进行匹配结果为false。
package cn.itcast.demo01;
/*
* 实现正则规则和字符串进行匹配,使用到字符串类的方法
* String类三个和正则表达式相关的方法
* boolean matches(String 正则的规则)
* "abc".matches("[a]") 匹配成功返回true
*
* String[] split(String 正则的规则)
* "abc".split("a") 使用规则将字符串进行切割
*
* String replaceAll( String 正则规则,String 字符串)
* "abc0123".repalceAll("[\\d]","#")
* 按照正则的规则,替换字符串
*/
public class RegexDemo {
public static void main(String[] args) {
checkTel();
}
/*
* 检查手机号码是否合法
* 1开头 可以是34578 0-9 位数固定11位
*/
public static void checkTel(){
String telNumber = "1335128005";
//String类的方法matches
boolean b = telNumber.matches("1[34857][\\d]{9}");
//为什么第二位不需要空格或者逗号呢,记住吧
System.out.println(b);
}
/*
* 检查QQ号码是否合法
* 0不能开头,全数字, 位数5,10位
* 123456
* \\d \\D匹配不是数字
*/
public static void checkQQ(){
String QQ = "123456";
//检查QQ号码和规则是否匹配,String类的方法matches
boolean b = QQ.matches("[1-9][\\d]{4,9}"); // \d 表示0到9 那为什么这里用\\d呢
//原因:\\d,第一个\转义第二个\,这样才表示\d
System.out.println(b);
}
}
package cn.itcast.demo01;
public class RegexDemo1 {
public static void main(String[] args) {
replaceAll_1();
}
/*
* "Hello12345World6789012"将所有数字替换掉
* String类方法replaceAll(正则规则,替换后的新字符串)
*/
public static void replaceAll_1(){
String str = "Hello12345World6789012";
str = str.replaceAll("[\\d]+", "#");//将每个数字串改成#
//str = str.replaceAll("[\\d]", "#");将每个数字改成#
System.out.println(str);
}
输出:Hello#World#
/*
* String类方法split对字符串进行切割
* 192.168.105.27 按照 点切割字符串
*/
public static void split_3(){
String ip = "192.168.105.27";
String[] strArr = ip.split("\\.");//转移成普通的.,否则输出的是空的数组
System.out.println("数组的长度"+strArr.length);
for(int i = 0 ; i < strArr.length ; i++){
System.out.println(strArr[i]);
}
}
输出:数组的长度4
192
168
105
27
/*
* String类方法split对字符串进行切割
* 18 22 40 65 按照空格切割字符串
*/
public static void split_2(){
String str = "18 22 40 65";
String[] strArr = str.split(" +"); //+代表的是空格出现一次或多次
System.out.println("数组的长度"+strArr.length);
for(int i = 0 ; i < strArr.length ; i++){
System.out.println(strArr[i]);
}
}
输出:数组的长度4
18
22
40
65
/*
* String类方法split对字符串进行切割
* 12-25-36-98 按照-对字符串进行切割
*/
public static void split_1(){
String str = "12-25-36-98";
//按照-对字符串进行切割,String类方法split
String[] strArr = str.split("-");
System.out.println("数组的长度"+strArr.length);
for(int i = 0 ; i < strArr.length ; i++){
System.out.println(strArr[i]);
}
输出:数组的长度4
12
25
36
98
}
}
1.5 正则表达式练习
匹配正确的数字
匹配规则:
匹配正整数:”\d+”
匹配正小数:”\d+\.\d+”
匹配负整数:”-\d+”
匹配负小数:”-\d+\.\d+”
匹配保留两位小数的正数:”\d+\.\d{2}”
匹配保留1-3位小数的正数:”\d+\.\d{1,3}”
匹配合法的邮箱
匹配规则:
”[a-zA-Z_0-9]+@[a-zA-Z_0-9]+(\.[a-zA-Z_0-9]+)+”
”\w+@\w+(\.\w+)+”
获取IP地址(192.168.1.100)中的每段数字
匹配规则:
”\.”
package cn.itcast.demo01;
public class RegexDemo2 {
public static void main(String[] args) {
checkMail();
}
/*
* 检查邮件地址是否合法
* 规则:
* 1234567@qq.com
* mym_ail@sina.com
* nimail@163.com
* wodemail@yahoo.com.cn
*
* @: 前 数字字母_ 个数不能少于1个
* @: 后 数字字母 个数不能少于1个
* .: 后面 字母
*
*/
public static void checkMail(){
String email ="abc123@sina.com";
boolean b = email.matches("[a-zA-Z0-9_]+@[0-9a-z]+(\\.[a-z]+)+");
//含义:代表的字母或者数字或者下划线(即单词字符),看不懂就去上面查字符类
System.out.println(b);
}
}
第2章 Date
2.1 Date类概述
类 Date 表示特定的瞬间,精确到毫秒。
继续查阅Date类的描述,发现Date拥有多个构造函数,只是部分已经过时,但是其中有未过时的构造函数可以把毫秒值转成日期对象。
//创建日期对象,把当前的毫秒值转成日期对象
Date date = new Date(1607616000000L);
System.out.println(date);
//打印结果:Fri Dec 11 00:00:00 CST 2020
可是将毫秒值转成日期后,输出的格式不利于我们阅读,继续查阅API,Date中有getYear、getMouth等方法,可以他们已经过时,继续往下查阅,看到了toString方法。
点开toString()方法查阅,原来上面打印的date对象就是默认调用了这个toString方法,并且在这个方法下面还有让我们参见toLocaleString方法,点进去,这个方法又过时了,从 JDK 1.1 开始,由 DateFormat.format(Date date) 取代。
既然这个方法被DateFormat.format(Date date) 取代,那么就要去查阅DateFormat类。
package cn.itcast.demo02;
import java.util.Date;
/*
* 时间和日期类
* java.util.Date
*
* 毫秒概念: 1000毫秒=1秒
*
* 毫秒的0点:
* System.currentTimeMillis() 返回值long类型参数
* 获取当前日期的毫秒值 3742769374405
* 时间原点; 公元1970年1月1日,午夜0:00:00 英国格林威治 毫秒值就是0
* 时间2088年8月8日
*
* 重要: 时间和日期的计算,必须依赖毫秒值
* XXX-XXX-XX = 毫秒
*
* long time = System.currentTimeMillis();
System.out.println(time);
*/
public class DateDemo {
public static void main(String[] args) {
function_3();
}
/*
* Date类方法 setTime(long )传递毫秒值
* 将日期对象,设置到指定毫秒值上
* 毫秒值转成日期对象
* 输出:Sun Dec 06 22:51:28 CST 2020
Thu Jan 01 08:00:00 CST 1970
* Date的构造方法
*/
public static void function_3(){
Date date = new Date();
System.out.println(date);
date.setTime(0);
System.out.println(date);
}
/*
* Date类方法 getTime() 返回值long
* 返回的是毫秒值
* 将Date表示的日期,转成毫秒值
* 输出:1607266158056
* 日期和毫秒值转换
*/
public static void function_2(){
Date date = new Date();
long time = date.getTime();//将data表示的日期转换为毫秒值
System.out.println(time);
}
/*
* Date类的long参数的构造方法
* Date(long ) 表示毫秒值
* 传递毫秒值,将毫秒值转成对应的日期对象
* 输出: Thu Jan 01 08:00:00 CST 1970 传递一个毫秒值,将毫秒值转换为对应的日期,Java从1970 00 00 00 开始(这个时区和格林威治时间有八个小时的时差)
*/
public static void function_1(){
Date date = new Date(0);
System.out.println(date);
}
/*
* Date类空参数构造方法
* 获取到的是,当前操作系统中的时间和日期
*输出: Sun Dec 06 22:47:39 CST 2020
*/
public static void function(){
Date date = new Date();
System.out.println(date);
}
}
第3章 DateFormat
3.1 DateFormat类概述
DateFormat 是日期/时间格式化子类的抽象类,它以与语言无关的方式格式化并解析日期或时间。日期/时间格式化子类(如 SimpleDateFormat类)允许进行格式化(也就是日期 -> 文本)、解析(文本-> 日期)和标准化。
我们通过这个类可以帮我们完成日期和文本之间的转换。
继续阅读API,DateFormat 可帮助进行格式化并解析任何语言环境的日期。对于月、星期,甚至日历格式(阴历和阳历),其代码可完全与语言环境的约定无关。
3.2 日期格式
要格式化一个当前语言环境下的日期也就是日期 -> 文本),要通过下面的方法来完成。DateFormat是抽象类,我们需要使用其子类SimpleDateFormat来创建对象。
构造方法
DateFormat类方法
代码演示:
//创建日期格式化对象,在获取格式化对象时可以指定风格
DateFormat df= new SimpleDateFormat(“yyyy-MM-dd”);//对日期进行格式化
Date date = new Date(1607616000000L);
String str_time = df.format(date);
System.out.println(str_time);//2020年12月11日
DateFormat类的作用:即可以将一个Date对象转换为一个符合指定格式的字符串,也可以将一个符合指定格式的字符串转为一个Date对象。
指定格式的具体规则我们可参照SimpleDateFormat类的说明,这里做简单介绍,规则是在一个字符串中,会将以下字母替换成对应时间组成部分,剩余内容原样输出:
当出现y时,会将y替换成年
当出现M时,会将M替换成月
当出现d时,会将d替换成日
当出现H时,会将H替换成时
当出现m时,会将m替换成分
当出现s时,会将s替换成秒
3.3 DateFormat类常用方法
format方法,用来将Date对象转换成String
parse方法,用来将String转换成Date(转换时,该String要符合指定格式,否则不能转换)。
代码演示:
练习一:把Date对象转换成String
Date date = new Date(1607616000000L);//Fri Dec 11 00:00:00 CST 2020
DateFormat df = new SimpleDateFormat(“yyyy年MM月dd日”);
String str = df.format(date);
//str中的内容为2020年12月11日
练习二:把String转换成Date对象
String str = ”2020年12月11日”;
DateFormat df = new SimpleDateFormat(“yyyy年MM月dd日”);
Date date = df.parse( str );
//Date对象中的内容为Fri Dec 11 00:00:00 CST 2020
日期格式化format
package cn.itcast.demo02;
import java.text.SimpleDateFormat;
import java.util.Date;
/*
* 对日期进行格式化 (自定义)
* 对日期格式化的类 java.text.DateFormat 抽象类, 普通方法,也有抽象的方法
* 实际使用是子类 java.text.SimpleDateFormat 可以使用父类普通方法,重写了抽象方法
*/
public class SimpleDateFormatDemo {
public static void main(String[] args) {
function();
}
/*
* 如何对日期格式化
* 步骤:
* 1. 创建SimpleDateFormat对象
* 在类构造方法中,写入字符串的日期格式 (自己定义)
* 2. SimpleDateFormat调用方法format对日期进行格式化
* String format(Date date) 传递日期对象,返回字符串
* 日期模式:
* yyyy 年份
* MM 月份
* dd 月中的天数
* HH 0-23小时
* mm 小时中的分钟
* ss 秒
* yyyy年MM月dd日 HH点mm分钟ss秒 汉字修改,: - 字母表示的每个字段不可以随便写
*/
public static void function(){
SimpleDateFormat sdf = new SimpleDateFormat("yyyy年MM月dd日 HH点mm分钟ss秒");
String date = sdf.format(new Date());
System.out.println(date);
}
}
字符串转为日期对象用parse
package cn.itcast.demo02;
import java.text.ParseException;
import java.text.SimpleDateFormat;
import java.util.Date;
/*
* DateFormat类方法 parse
* 将字符串解析为日期对象
* Date parse(String s) 字符串变成日期对象
* String => Date parse
* Date => String format
*
*/
public class SimpleDateFormatDemo1 {
public static void main(String[] args) throws Exception{
function();
}
/*
* 将字符串转成Date对象
* DateFormat类方法 parse
* 步骤:
* 1. 创建SimpleDateFormat的对象
* 构造方法中,指定日期模式
* 2. 子类对象,调用方法 parse 传递String,返回Date
*
* 注意: 时间和日期的模式yyyy-MM-dd, 必须和字符串中的时间日期匹配
* 1995-5-6
*
* 但是,日期是用户键盘输入, 日期根本不能输入
* 用户选择的形式
*/
public static void function() throws Exception{
SimpleDateFormat sdf = new SimpleDateFormat("yyyy-MM-dd");
Date date = sdf.parse("1995-5-6");
System.out.println(date);
}
}