自然语言处理
文章平均质量分 69
沉香屑_
这个作者很懒,什么都没留下…
展开
-
形式语言与自动机
形式语言1.形式语法定义无论哪种语言都是句子和符号串的集合,描述一种语言的三种方法: 1. 穷举法:把语言中的所有句子都枚举出来。 2. 文法描述:语言中的每个句子用严格定义的规则来构造,利用规则生成语言中合法的句子。(用来精确地描述语言和其结构) 3. 自动机法:通过对输入的句子进行合法性检验,区别哪些是语言中的句子,哪些不是。(用来机械地刻画对输入字符串的识别过程)定义(形式语法):一个四原创 2017-07-11 22:51:40 · 6835 阅读 · 0 评论 -
MCMC采样算法理解
MCMC采样算法完整的MCMC采样算法已经有很多博主发布了,这里就不再重复了。主要想分享一下在看其他博主写的MCMC采样算法时,不太理解的地方。MCMC采样关键问题在于如何构建转移矩阵,使得平稳分布恰好是p(x)。主要使用细致平稳条件。细致平稳条件如果非周期马氏链的转移矩阵P和分布π(x)满足: π(i)Pij=π(j)Pji for all i,j 则π(x)是马尔可夫链的平稳分布,上式称为原创 2017-05-12 16:41:44 · 6028 阅读 · 1 评论 -
The Penn Treebank
standFord parser 标签原创 2017-07-04 16:49:29 · 3282 阅读 · 2 评论 -
自然语言处理-分布表示
自然语言处理 分布式表示原创 2017-07-20 22:48:35 · 8459 阅读 · 0 评论 -
Word2Vec详解
Word2Vec转载 2017-10-23 21:53:40 · 320 阅读 · 0 评论 -
简洁的文本处理代码
函数1.sorted()2.collections模块的Counter类3.zip()代码 #(1)按文本的长度排序 contents = sorted(contents, key=lambda l: len(l)) #(2)存储contents中出现的所有字、符号 all_words = [] for content in contents: ...原创 2018-05-28 21:26:06 · 1802 阅读 · 0 评论 -
pyltp安装方法
安装pyltp各种报错,总结一下安装成功了的方法。python2.7安装pip install pyltp==0.1.9.1python3.6安装下载whl文件 https://download.csdn.net/download/qq_22521211/10460778 下载好了以后, 在命令行下, cd到wheel文件所在的目录, 然后使用命令pip...原创 2018-08-31 10:04:14 · 937 阅读 · 0 评论