nlp学习笔记

本文探讨了自然语言处理的难点,如一词多义,介绍了关键技术和算法,包括最大匹配算法、语言模型如Unigram、Bigram和N-gram,并讲解了智能客服系统的构建。此外,还涉及到了P vs NP问题、文本处理流程、拼写纠错和语义分析等核心概念。
摘要由CSDN通过智能技术生成

nlp难点

一个意思具有多种表达方式;而是一词多义(Ambiguity);
如何解决一词多义现象:在没有上下文(context)的情况下,可以主观判断一下;
搭建一个机器翻译系统:从语料库中匹配目标单词,其缺点在于:语法不对,速度慢可以通过AI的方法(模型)解决。如何保证语法的正确性:中文首先要分词,找到对应词,对词进行排列组合,将组合应用在模型(Language Model)上,得到一个概率,选最好的。其中的计算量特别大,采用算法解决。
Decoding algorithm and viterb algorithm(解决一个NP hard 问题). 综合考虑translation model 和 language model. P(c|e)和P(e) ~argmax(P(e)*P(c|e)。
decoding algorithm 给定语言模型,和翻译模型和f,判断argmax(P(e)*P(c|e)。
语言模型计算概率的方法:uni- gram 、bi_gram、tri-gram.N-gram.在于计算每个概率。p(x1,x2,x3,…) = p(x1)p(x2)…;

NLP关键技术

1,semantic(语义):
2,syntax(句子结构):依从分析
3, Morphology(单词):分词、词性分析、NER

  • phonetics(语音)

算法复杂度

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值