文本生成技术总结

27 篇文章 0 订阅
26 篇文章 0 订阅

decoder本质是一个lm问题

常用框架:encoder+decoder,  技术: seq2seq+attention-mechasim

encoder处理trick:增加feature输入维度要远好于语料累加;  feature维度:tfidf,ner,pos

decoder:利用 encoder-sequence+encoder-word-attention+encoder-sentence+attention

oov问题解决:lvt,利用decoder时候门口机制,generator/pointer

基于 embedding模型,对于低频词汇并不友好,pointer可以解决这个问题

生成式评估指标rouge acc=lcs(x,y)/y,recall=lcs(x,y)/x, 

 β=precision/(recall+e-12)

rouge= (1+β2)*precision*recall/( β2*precision+recall)

 

 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
文本处理技术是指对文本进行分析、处理、归纳和总结的一种技术。在信息化时代,随着互联网的普及和数据量的爆炸性增长,文本处理技术变得越来越重要。本文将介绍文本处理技术的基础知识、应用场景和发展趋势。 一、文本处理技术的基础知识 1.自然语言处理(NLP) 自然语言处理是一种计算机科学分支,它涉及人类语言的计算机处理和分析。NLP的目标是使计算机能够理解、解释、生成自然语言。NLP涉及多个子领域,如文本分类、信息提取、机器翻译、语音识别等。 2.文本预处理 文本预处理是指将原始文本转换为可用于分析的格式。文本预处理的步骤包括文本清洗、分词、去停用词、词干提取、词向量化等。 3.文本分类 文本分类是指将文本分成多个类别。文本分类通常用于垃圾邮件过滤、情感分析等场景。 4.文本聚类 文本聚类是指将文本分成相似的组。文本聚类通常用于信息检索、知识管理等场景。 5.情感分析 情感分析是指对文本进行情感分类。情感分析通常用于评估产品或服务的用户情感。 二、文本处理技术的应用场景 1.智能客服 智能客服是指使用自然语言处理技术实现的在线客服系统。智能客服可以自动回答用户的问题,提高客户服务效率。 2.舆情监测 舆情监测是指使用文本处理技术对社交媒体、新闻等文本进行分析,了解公众对某个话题的看法和情感。 3.智能写作 智能写作是指使用自然语言处理技术生成文章、新闻等文本。智能写作可以减少人工写作的成本和时间。 4.知识图谱 知识图谱是指将实体、属性、关系等知识组织成一张图谱。知识图谱可以用于问答系统、搜索引擎等场景。 5.机器翻译 机器翻译是指使用自然语言处理技术将一种语言翻译成另一种语言。机器翻译可以帮助不同语言的人们进行交流和理解。 三、文本处理技术的发展趋势 1.深度学习 深度学习是一种基于神经网络的机器学习方法,可以用于自然语言处理。深度学习可以通过大量的数据训练模型,获得更高的准确率和效率。 2.多语言处理 多语言处理是指使用自然语言处理技术处理不同语言的文本。多语言处理可以让计算机具备处理全球范围内的文本的能力。 3.结合其他技术 文本处理技术可以和其他技术结合,如计算机视觉、语音识别等。这种结合可以让计算机更好地理解和处理人类语言。 4.自适应学习 自适应学习是指使用自然语言处理技术让计算机可以不断学习和适应新的语言和文本。自适应学习可以让计算机更加智能化和灵活。 结论 文本处理技术在信息化时代扮演着越来越重要的角色。通过自然语言处理文本预处理、文本分类、情感分析、文本聚类等技术文本处理技术可以应用于智能客服、舆情监测、智能写作、知识图谱、机器翻译等场景。未来,随着深度学习、多语言处理、结合其他技术、自适应学习等技术的发展,文本处理技术将会更加智能化、灵活和高效。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值