![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
自然语言处理NLP
文章平均质量分 55
仰望-NLQ
simple
展开
-
复述抽取生成doc01-思路方法确立
经过近似一个月的各种看中文英文复述研究的论文,最终选定基于单个单语语料库,从中抽取复述patterns,用于新句子的复述生成。下载了搜狗实验室几百M的网页数据,发现这种单语的网页数据,从中找到复述句子对可能性非常小,而且代价很高。对于一个特定的句子,其中的复述句0.1%都不可能有。基于上面的考虑,决定采取搜索引擎,搜索与句子相关的数据作为训练复述pattern。在百度中自己验证了一下,基本上可以找原创 2013-10-21 18:38:52 · 1357 阅读 · 0 评论 -
复述抽取生成doc03-实现01
编程实现01定义一个句子类NewSentence,包含基本的句子,分词后的结果,以及句法分析树结果,以及句子中的锚点对象(命名实体)分词采用IKAnalyzer句法分析以及依存分析采用stanford parser(分析一个句子比较慢 加载汉语模型要1秒多)结果如下:*句子“我计划出去旅行。”:Loading parser from serialized file models/c原创 2013-10-21 18:42:15 · 947 阅读 · 0 评论 -
基于数据(语料库)的复述粗略综述
基于数据(语料库)的复述粗略综述By牛力强 2013年9月24日NLP CS NJUEmail:simpleniulq2013@gmail.com1.复述1.1复述(paraphrase):在与原句表达相同的语义内容,同一种语言下的原句的替代形式。1.2复述产生的层次(level):词汇复述(lexical paraphrase):个别词汇(individual l原创 2013-10-06 20:48:42 · 5562 阅读 · 0 评论 -
复述抽取生成doc02-复述抽取生成流程图
基于前面doc01确定的思路,本文档给出复述抽取生成的流程图,附件PDF以及图片所示。原创 2013-10-21 18:41:20 · 1085 阅读 · 0 评论 -
中文词性标注 符号表示
Definitions of Chinese Part-of-Speech中文词性标注(33) [1] AD 副词 Adverbs[2] AS 语态词 --- 了[3] BA 把[4] CC 并列连接词(coordinating conj)[5] CD 许多(many)转载 2013-10-23 20:54:23 · 5537 阅读 · 0 评论 -
hello world
hello world. this is my first day start to wirting blog artical.that is all.2013年8月1日15:20:31原创 2013-08-01 15:21:19 · 541 阅读 · 0 评论 -
word2vec学习笔记2
鉴于前面word2vec在大数据集上由于分词器原创 2014-06-03 22:46:39 · 1969 阅读 · 0 评论 -
google word2vec源码剖析
// Copyright 2013 Google Inc. All Rights Reserved.//// Licensed under the Apache License, Version 2.0 (the "License");// you may not use this file except in compliance with the License.// You原创 2014-08-26 22:59:54 · 2235 阅读 · 0 评论