![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
NLP
Suata
对不起,我给中大软工丢人了,,,
展开
-
【python】 正则表达式
正则表达式概念 正则表达式是对字符串操作的一种逻辑公式,是用事先定义好的一些特定字符、及这些特定字符的组合,组成一种规则字符串,从而表达一种过滤逻辑。在程序设计中,通常使用正则表达式来检索和替换那些符合某种规则(模式)的文本。 python编译正则表达式 使用python编译正则表达式时,需要引入re模块,此时可以使用正则表达式的所有功能 1. re.compile(parttern[, f...原创 2019-11-26 11:53:04 · 206 阅读 · 0 评论 -
【NLP】nltk使用方法归纳
ntlk是一个比较常用的用于自然语言处理的python库,在这篇文章中,将会对ntlk的使用进行总结和归纳。 相关代码示例 text = ’Don’t hesitate to ask questions. Be positive‘ 安装:安装使用pip正常安装即可,但是在第一次使用前要利用download命令,并在弹出的下载器中下载相应的文件包,全部下载需要2G左右。下载时要开VPN,否则服...原创 2019-11-26 11:51:07 · 1423 阅读 · 0 评论 -
【NLP】最小编辑距离
用例 问:最少操作多少次可以把字符串T变为S? 例:S=“ABCF”,T=“DBFG” 则可以 把D替换为A 删掉G 插入C 最短编辑距离概念 给定两个字符串S和T,对于T,我们允许如下三个操作 在任意位置添加任一字符 删除存在的任一字符 修改任一字符 将字符串T转换成成字符串S所使用的操作次数就是编辑距离,其中,最少的操作次数就是最短编辑距离(Min Edit Distance) 算法...原创 2019-11-26 11:43:42 · 243 阅读 · 0 评论