自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

转载 CNN在NLP领域的实践(1) 文本分类

CNN在NLP领域的实践(1) 文本分类众所周知,卷积神经网络(CNN)在计算机视觉领域取得了极大的进展,但是除此之外CNN也逐渐在自然语言处理(NLP)领域攻城略地。本文主要以文本分类为例,介绍卷积神经网络在NLP领域的一个基本使用方法,由于本人是初学者,而且为了避免东施效颦,所以下面的理论介绍更多采用非数学化且较为通俗的方式解释。0.文本分类所谓文本分类,就是使用计算机将一篇文本分为a类或者b...

2018-06-12 09:24:44 734

转载 中文组织机构名与简称的识别

中文组织机构名与简称的识别2009年11月13日 11:46:00阅读数:2587中文组织机构名与简称的识别可以通过确定其左右界来实现,通过组织机构称谓词库获得右边界,运用规则匹配以及贝叶斯概率模型决策出最有规则获取左边界,全称——简称——运用简称规则。命名实体识别主要有:人名、地名、组织机构名、日期、时间、百分数和货币等。其中人名、地名、组织机构名是最常用到的三种。组织机构名识别的四大难点:1、...

2018-06-06 10:42:52 3104

转载 TF-IDF及其算法

TF-IDF及其算法概念     TF-IDF(term frequency–inverse document frequency)是一种用于资讯检索与资讯探勘的常用加权技术。TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。TF-IDF加权的各种形式常被搜寻...

2018-05-24 13:49:06 379

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除