第3章:统计语言模型
-
自 然 语 言 从 它 产 生 开 始 , 逐 渐 演 变 成 一 种上 下 文 相 关 的 信 息 表 达 和 传 递 的 方 式 , 因 此 让 计 算 机 处 理 自 然 语 言 , 一个 基 本 的 问 题 就 是 为 自 然 语 言 这 种 上 下 文 相 关 的 特 性 建 立 数 学 模 型 。 这个 数 学 模 型 就 是 在 自 然 语 言 处 理 中 常 说 的 **统 计 语 言 模 型 ( Statistical Language Model ) **, 它 是 今 天 所 有 自 然 语 言 处 理 的 基 础 , 并 且 广 泛 应 用于 机 器 翻 译 、 语 音 识 别 、 印 刷 体 或 手 写 体 识 别 、 拼 写 纠 错 、 汉 字 输 入 和文 献 查 询 。
-
判断一个文字序列是否合乎文法、含义是否正确等,贾里尼克的做法是:一个句子是否合理,就看看它的可能性大小如何。