standford NLP课程笔记一 正则表达式

课程地址

https://www.coursera.org/course/nlp


​记得以前在网页上查正则表达式时,总是被那些归纳总结的表看到头昏压花,今天学了视频课程,感觉学到好多,至少很基本的东西是知道了一些,自己能读写简单的正则表达式了。

[] 里面的字符表示每个都可以,比如

[wW]oodchuck 可以表示woodchuck和Woodchuck

[1234567890]表示任何单个数字

表示范围的-

[A-Z]表示所有大写字母

[a-z]表示所有小写字母

[0-9]表示所有单个数字

表示否定的^

[^A-Z]不要大写的字母

[^a-z]不要小写的字母

[^ae]不要a也不要e​

[^e^]不要e也不要^,这里第二个^就表示字符^

a^b​  没讲???

表示或者 |

groundhog|woodchuck表示​要么是groundhog 要么是woodchuck

a|b|c与[abc]意思一样,都表示要么是a要么是b要么是c

[gG]roundhog|[wW]oodchuck表示​groundhog,Groundhog,woodchuck,Woodchuck

? 表示前一个字符可有可没有

colou?r表示colour和color​

* 表示前一个字符可以有0个或多个

oo*h表示oh,ooh,oooh,ooooh等​

+表示前一个字符可以有1个或多个

o+h表示​oh,ooh,oooh,ooooh等​

.表示任意字符​

beg.n表示begin,begun,beg3n等

表示打头^(注意与表示否定的格式区别)

^[A-Z]以大写字母打头​

^[a-z]以小写字母打头​

^[^A-Za-z]以非字母打头

表示 结尾$

\.$ 以句号.结尾,由于.是一个特殊字符,因此前面加上斜杠表示该字符

.$ 以任意字符结尾​


测试

Which of the following common spelling of Britney Spear's first name are not covered in this regular expression:brit*[ea]?ne?y

[^A-Za-z]​

​false negtives

第一个词true和false表示对还是错,就是本次操作的结果是对的还是错的,上面​的两种错误都是false

第二个词positive和negtive表示是匹配到了还是没匹配到

NLP里面也会有类似的错误

提高准确率->降低false positives

提高召回率->降低false negative​s

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值