python –“(?u)”对正则表达式有什么作用?

在研究了如何在scikit-learn中实现标记化之后,我们找到了这个正则表达式(source)。

 

token_pattern = r"(?u)\b\w\w+\b"

正则表达式非常简单,但是(?U)部分从未见过。有人可以告诉我这部分在做什么吗?

答案

 
该表达式打开re.Ure.UNICODE)标志
 

从模块文档

 

(?iLmsux)

(一个或多个字母从集合'i''L''m''s''u''x'。)的组相匹配的空字符串;字母设置相应的标志:re.I(忽略大小写), re.L(与当前位置有关), re.M(多线),(re.S点匹配所有) ,re.U(取决于Unicode)和re.X(详细)(对于整个正则表达式)(标志在模块内容中进行了描述。)如果希望将标志包括在正则表达式中,而不是传递标志参数,则这很有用。收件人re.compile()功能。

https://codeday.me/jp/qa/20190322/452983.html
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值