人工智能
文章平均质量分 60
飞跃小龙猫
这个作者很懒,什么都没留下…
展开
-
浅谈TF-IDF原理
一、基本概念特征提取:从原始数据中抽取特征TF-IDF:词频-逆向文件频率,是一种在文本挖掘中广泛使用的特征向量化方法词语:用t表示文档:用d表示语料库:用D表示词频TF(t,d):词语t在文档中d中出现的次数文件频率DF(t,D):包含词t的文档的个数二、原理如果我们只是用词频来衡量重要性,很容易过度强调在文档中经常出现,却没有太多实际信息的词语,比如“a”,“the”以及“of”。如果一个词语经常出现在语料库中,意味着他不能很好的对文档进行分区。TF-IDF就..原创 2021-05-31 22:38:27 · 572 阅读 · 0 评论 -
深度学习之注意力机制
一、前提该篇为基于实现LSTM中文情感倾向分析的基础上,为提高情感倾向预测的准确度,而引入的一个注意力机制模块,通过翻阅相关学术文献和其他资料所作的归纳总结。二、注意力机制简介简单来说,注意力机制与人类视觉注意力相似,正如人在看事物一样,会选择重点的对象,而忽略次要对象。近几年来,注意力机制在图片处理领域和自然语言处理领域得到广泛的应用,并展现出显著的效果。注意力机制主要是利用神经网络找到输入特征的有效部分。三、Encoder-Decoder模型注意力机制的框架主要是基于Encoder-原创 2021-05-31 22:26:36 · 1333 阅读 · 0 评论