声音–>汉字–>词–>确定词性–>得到句子
一直面临着多选一的问题,一个音调可以是很多个汉字,不同的汉字组合成不同的词语,不同的词语词性不同,能够得到不同的句子,最后,同一个句子不同的理解能够得到不同的含义。
NLP的核心问题就是 :歧义
NLP的核心人物是:消除歧义
一个音可以对应哪些字
哪些词的组合有意义
语言处理需要的知识:
1.语言学的知识:吃是动词
2.非语言学的知识:主要是常识:吃苹果(正确),喝苹果(不正确)
知识的获取与表示
(一)(理性主义)
1.知识是人类自身总结得到的,以规则\谓词等表示
2.语言学的知识
(二)来源于语料(经验主义)(语料是语言的数据)
1.从大料的数据中抽取知识(大数据分析)
知识获取后,应用知识,解决问题,常用的模型:
1.状态机
2.形式系统
3.概念统计模型
4.神经网络模型
设计算法获得模型的解,常用的算法有:
1.搜索算法
2.动态规划算法
3.优化算法