Dictionary-based methods for information extraction
基于字典序方法的信息提取
本质:分类问题
通过熵(entropy)来量化单词信息在全文中的含义
Kolmogorov 复杂性
定义:Kolmogorov复杂度可以定义为任何数学对象,但为简单起见,本文仅限于字符串。我们必须首先为字符串指定一种描述语言。这种描述语言可以基于任何计算机编程语言,如Lisp、Pascal或Java。如果P是一个输出字符串x的程序,那么P是x的描述。描述的长度就是P作为字符串的长度,乘以一个字符的位数
我们也可以为图灵机选择一个编码,其中编码是一个函数,它与每个图灵机M.
原创
2021-07-09 18:47:10 ·
361 阅读 ·
0 评论