正则表达式和list set集合

正则表达式,  list集合  set集合
\d:0,9之间的任意字符  8
\D:非0,9之间的任意其他字符
\s:空白字符,如空格、制表符、回车符、换行符等不可见字符
\S:非空白字符,可见字符
\w:所有的单词字符(不包括$)a-zA-Z_0-9
\W:所有的非单词字符 
.所有字符
元字符的个数限制
 元字符m:表示m个元字符,如\d5  
 元字符m,:至少m个元字符,如\d5, 
 元字符m,n:至少m个、最多n个元字符\d5,8
 元字符?:表示0个或1个元字符,相当于 元字符0,1
元字符*:表示0个或多个元字符,相当于 元字符0,
元字符+:表示1个或多个元字符,相当于 元字符1, 
元字符列表,如:abcdefg789简写为a-f7-9
~adx表示a、d、x之外的元字符
List集合
List接口是有序的列表,与父类 Collection比包含了Collection所有的方法,又扩展了能精确地控制每个位置上的元素的方法:
list.get(i);读取第i位置的元素;
add(int index, E element)指定位置添加元素
remove(int index)移除指定位置的元素
set(int index, E element) 
subList(int fromIndex, int toIndex)截取子列表
List有三种实现方式:ArrayList、LinkedList
是同一个接口的实现,所以操作和方法都是相同的,但是具体的实现方式不一样
ArrayList:数组实现方式,查询速度快,按位增删速度慢
LinkedList:链表的实现方式,按位增删速度快,查询速度慢
Set集合:Set 是一个散列的集合,数据会按照散列值存储的,两个hello的散列值相同,会存储在同一个地址中
Set的特征是:
不会出现重复的元素(按照equals 和hashCode 的规则比较是否重复)
Set属于Collection的子接口,拥有Collection的所有的方法
Set 是散列存储没有位置编号,没有按照编号进行操作的方法
Set接口也有不同的实现方式:
HashSet:散列集合里存储的对象必须正确重写hashCode和equals方法
TreeSet:树集集合通过二叉树算法保证无重复元素,并对元素进行排序(自然顺序)
要求要存储的类要实现Comparable接口,重写compareTo方法(后续会将排序的接口)
CompareTo方法的返回值决定着排序后的顺序( 1 -1 0  )排序后为升序。相反则为倒
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
引用\[2\]:regexp_replace(string A, string B, string C) 返回值: string 说明:将字符串A中的符合Java正则表达式B的部分替换为C。注意,在有些情况下要使用转义字符,类似Oracle中的regexp_replace函数。 引用\[3\]:做为转意,即通常在"/"后面的字符不按原来意义解释,如/b/匹配字符"b",当b前面加了反斜杆后//b/,转意为匹配一个单词的边界。 -或- 对正则表达式功能字符的还原,如"*"匹配它前面元字符0次或多次,/a*/将匹配a,aa,aaa,加了"/"后,/a/*/将只匹配"a*"。 ^匹配一个输入或一行的开头,/^a/匹配"an A",而不匹配"An a"$匹配一个输入或一行的结尾,/a$/匹配"An a",而不匹配"an A"*匹配前面元字符0次或多次,/ba*/将匹配b,ba,baa,baaa+匹配前面元字符1次或多次,/ba*/将匹配ba,baa,baaa?匹配前面元字符0次或1次,/ba*/将匹配b,ba(x)匹配x保存x在名为$1...$9的变量中x|y匹配x或y{n}精确匹配n次{n,}匹配n次以上{n,m}匹配n-m次\[xyz\]字符集(character set),匹配这个集合中的任一一个字符(或元字符)\[^xyz\]不匹配这个集合中的任何一个字符\[/b\]匹配一个退格符/b匹配一个单词的边界/B匹配一个单词的非边界/cX这儿,X是一个控制符,//cM/匹配Ctrl-M/d匹配一个字数字符,//d/ = /\[0-9\]//D匹配一个非字数字符,//D/ = /\[^0-9\]//n匹配一个换行符/r匹配一个回车符/s匹配一个空白字符,包括/n,/r,/f,/t,/v等/S匹配一个非空白字符,等于/\[^/n/f/r/t/v\]//t匹配一个制表符/v匹配一个重直制表符/w匹配一个可以组成单词的字符(alphanumeric,这是我的意译,含数字),包括下划线,如\[/w\]匹配"$5.98"中的5,等于\[a-zA-Z0-9\]/W匹配一个不可以组成单词的字符,如\[/W\]匹配"$5.98"中的$,等于\[^a-zA-Z0-9\]。 根据以上引用内容,hivesql中的正则表达式'^\\n|\\n$'的含义是匹配以换行符开头或以换行符结尾的字符串。其中,'^\\n'表示匹配以换行符开头的字符串,'\\n$'表示匹配以换行符结尾的字符串。 #### 引用[.reference_title] - *1* [hive 常用正则表达式](https://blog.csdn.net/zhao_guo_feng/article/details/125677840)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insert_down28v1,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* [hive sql 正则表达式](https://blog.csdn.net/u011919863/article/details/119900339)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insert_down28v1,239^v3^insert_chatgpt"}} ] [.reference_item] - *3* [hive SQL 中的正则表达式](https://blog.csdn.net/wplblog/article/details/113744635)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insert_down28v1,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值