第一章 文字和语言VS数字和信息
- 翻译这件事之所以能达成,仅仅是因为不同的文字系统在记录信息上得能力是等价的。P5
- 信息的冗余是信息安全的保障。P6
- 语言的数据,称之为语料。P6
第二章 自然语言处理
- 我们把一个要表达的意思,通过某种语言的一句话表达出来,就是用这种语言的编码方式对头脑中的信息做了一次编码,编码的结果就是一串文字。如果对方懂得这门语言,就可以解码获得说话人要表达的信息。
- 图灵测试:让人和机器进行交流,如果人无法判断自己交流的对象是人还是机器,就说明这个机器有智能了。
- 句法分析树:徐志摩喜欢林徽因。
小结
了解自然语言处理的历史,懂得基于统计的语言处理模型其实和数学、通信等领域是相通的。