自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 Python输出日志

https://docs.python.org/2/howto/logging-cookbook.htmlimport loggingif __name__ == '__main__': # https://docs.python.org/2/howto/logging-cookbook.html logger = logging.getLogger('eval_trec_cnn')

2017-03-31 14:01:02 737

原创 分析句子结构

文法的用途学习文法的一个好处是,凭借概念框架和词汇表能培养出句子正确或错误的直觉。成分结构是词与词结合在一起组成的单元。通过词汇的可替代性可以证明词系列是怎样形成这样一个单元的——在符合语法规则句子中的词系列可以被一个更小的且不会导致句子不符合语法规则的序列替代。句法类型 符号 意思 例子 S 句子 the man walked NP 名词短语 a dog VP

2017-03-06 15:23:55 2764

原创 信息抽取

结构化数据: 实体和关系的规范和可预测的组织。将自然语言句子这样的非结构化数据转换成结构化数据,然后利用强大的查询工具,如SQL。这种从文本中获取意义的方法被称为信息提取。信息提取系统搜索大量非结构化文本,寻找特定类型的实体和关系,并用它们来填充有组织的数据库。这些数据库可以用来寻找特定问题的答案。简单的信息提取系统结构使用句子分割器将文档的原始文本分割成句使用分词器将每个句子进一步细分为词对

2017-03-06 15:14:43 2954

原创 词性标注

标注是典型的NLP流水线中继分词之后的第二个步骤在NLP流程中,对工具的性能评估是NLP的一个中心主题,一个模块输出中的任何错误在下游模块都被无限放大了!词性标注(part-of-speech tagging, POS tagging)给文本中的词自动分配词性的过程称为词性标注、POS标注或标注。词性标注是NLP中一个重要的、早期的序列分类任务:利用局部上下文语境中的词和标记,对序列中任意一点的分类

2017-03-03 10:06:32 2040

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除