- 博客(2)
- 资源 (20)
- 收藏
- 关注
原创 基于条件随机场(CRF)的组织机构实体识别
组织机构实体主要指企事业单位、公司、组织、网站等。我的主要是从文本中识别出组织机构实体名称来。鉴于条件随机场在序列标注方面的优势,以及处理词语特征包括上下文环境特征方面,这次工作采用了条件随机场,具体工具为CRF++。1.语料预处理采用的语料是1998年1月份的《人民日报》语料,这个语料资源是公开的,从网上可以下载到。语料的格式如下所示:语料中已经做好标注,其中nt表示组织机构
2014-12-26 15:11:46 8174 2
原创 Linux下CRF++安装工作
在平时工作中经常用到条件随机场(CRF)进行任务处理,比如做一些标注工作和命名实体识别工作。自己比较常用的工具就是CRF++,下载地址为。https://code.google.com/p/crfpp/windows下面直接使用即可,Linux需要做一些编译任务。下载后解压缩进入目录。运行命令./configure 提示如下错误需要先安装gcc。执行命令 sudo ap
2014-12-26 14:31:07 7592
NTKO_OFFICE文档控件JavaScript编程指南
2011-09-11
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人