自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

lpty的博客

走进科学

  • 博客(2)
  • 收藏
  • 关注

原创 命名实体:中文命名实体识别简介

一、概念 1、实体 一切具有特定属性集合的物体都可以称为实体。 2、命名实体 一般包括三大类(实体类、时间类、数字类),七小类(人名、机构名、地名、时间、日期、货币和百分比)。 3、命名实体识别过程 (1)确定实体的边界,即确定哪些词属于实体。 (2)确定实体的类别,即确定实体属于人名或者机构名等。 4、命名实体识别难点 (1)各类命名实体没有严格的命名规范 (

2018-01-22 10:46:00 9862

原创 词性标注:基于MaxEnt的中文词性标注模型实现

一、前言1、中文词性标注 2、最大熵模型二、数据源本文使用数据源未1988年的人民日报标注语料,手工进行处理,去除一些不符合标注规范(word/pos)的词语,词性标注见中文词性标注一文。三、实战1、特征提取最大熵模型与一般机器学习算法不同之处在于特征是对x,y的联合分布提取,而不是只对x进行特征提取。 这是简单的设定几个模板:前一个词与前词词性 当前词与当前词词性 后一个词与当前词词性 前一个

2018-01-02 10:51:59 2906 14

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除