NLP
文章平均质量分 62
rainysun
这个作者很懒,什么都没留下…
展开
-
CRF学习日记-1
把CRF的学习来的一点知识总结一下啊,脑子总是坏的很,一转眼就忘了,如果能给如我这样的NLP白脖和计算机菜鸟带来帮助的话,就更开心了。 1 概述: 对于想学习NLP的入门级人员来说,先找个模型,做一个简单的任务,俺以为是一个非常不错的方法,感谢导师,让俺选择CRF做实体识别。 我选择了CRF++,参考资料是CRF++的官方网站:C原创 2016-10-20 19:17:58 · 443 阅读 · 0 评论 -
深度学习中的epoch、 iteration和batchsize
(1)batchsize:批大小。在深度学习中,一般采用SGD训练,即每次训练在训练集中取batchsize个样本训练;(2)iteration:1个iteration等于使用batchsize个样本训练一次;(3)epoch:1个epoch等于使用训练集中的全部样本训练一次;举个例子,训练集有1000个样本,batchsize=10,那么:训练完整个样本集需要:100次i原创 2017-03-16 11:11:50 · 821 阅读 · 0 评论 -
Stanford Parser学习入门(3)-标记
以下是Stanford parser中的标记中文释义供参考。probabilistic context-free grammar(PCFG) ROOT:要处理文本的语句 IP:简单从句 NP:名词短语 VP:动词短语 PU:断句符,通常是句号、问号、感叹号等标点符号 LCP:方位词短语 PP:介词短语 CP:由‘的’构成的表示修饰性关系的短语 DN原创 2017-03-31 18:21:27 · 385 阅读 · 0 评论 -
英语词性的分类及用法详述
一、词性的分类 词类又叫词性,英语单词根据其在句子中的功用,可以分成十个大类。 1.名词 noun n. student 学生 2.代词 pronoun pron. you 你 3.形容词 adjective adj. happy 高兴的 4.副词 adverb adv. quickly 迅速地 5.动词 verb v. cut 砍、割 6.数词转载 2017-03-30 10:05:02 · 2428 阅读 · 0 评论 -
Penn Treebank词性标记集(符号说明)
编号 缩写 英文 中文1 CC Coordinating conjunction 并列连接词2 CD Cardinal number 基数3 DT Determiner 限定词4 EX Existential there 存在型there5 FW Foreign word 外文单词6 IN Preposition/subord原创 2017-03-30 10:01:03 · 1419 阅读 · 0 评论 -
ubuntu查看内存占用情况的简单方法
单独查看内存使用情况的命令:free -m查看内存及cpu使用情况的命令:top也可以安装htop工具,这样更直观,安装命令如下:sudo apt-get install htop安装完后,直接输入命令:htop就可以看到内存或cpu的使用情况了。原创 2017-03-29 17:58:00 · 14842 阅读 · 0 评论 -
使用 aptitude解决ubuntu下apt-get install g++依赖问题
问题描述: ubuntu下运行C++程序,给出了如下错误提示:程序“g++”尚未安装。使用以下命令安装:sudo apt-get install g++执行:得出如下错误:正在读取软件包列表... 完成正在分析软件包的依赖关系树正在读取状态信息... 完成有一些软件包无法被安装。如果您用的是 unstable 发行版,这也许是因为系原创 2017-03-07 11:13:36 · 2584 阅读 · 0 评论 -
windows环境下使用word2vector进行词向量训练的方法
word2vec,是google在2013年提出的开源项目,它实际上是一个Deep Learning模型,可以将词(word)表征成实数值向量,采用CBOW(Continuous Bag-Of-Words Model,连续词袋模型)和Skip-Gram(Continuous Skip-GramModel)两种模型。 在windows下使用word2vec训练词向量,需要以下几个步骤:原创 2017-02-27 09:55:28 · 3879 阅读 · 0 评论 -
使用conlleval.pl对CRF测试结果进行评价的方法
1.需安装perl的环境,测试。2下载conlleval.pl拷贝到某个文件夹的下面。2.conlleval.pl提供的有标准模板output.txt,必须严格按照此格式转换CRF的测试结果文件。3.列和列之间必须为空格(ASCII为20H),只能有一个空格;行之间为换行符\n(ASCII为0AH),不是回车换行符\r\n(ASCII为0D0AH);可以借助于ultraEdit来进原创 2016-11-16 17:46:06 · 6621 阅读 · 2 评论 -
ubuntu环境下JDK8的 安装与配置
1、下载JDK8安装包 下载地址是官网:http://www.Oracle.com/technetwork/Java/javase/downloads/jdk8-downloads-2133151.html2、解压 使用终端命令在/usr/local目录下新建java文件夹,命令行:sudo mkdir /usr/local/ja原创 2017-03-06 15:06:04 · 1294 阅读 · 0 评论