NLP
文章平均质量分 90
gladosAI
这个作者很懒,什么都没留下…
展开
-
NLP学习------HanLP使用实验
学习内容在之前的实验中得到了不在词向量里的词与分词结果,结果有500多个词不在词向量里,解决方案就是重新分词,或再追加训练这些词到词向量里。但后者相对麻烦且目前样本量不大。我跟据词向量的作者[6]所使用的分词工具来分词,会比不同工具(jieba)的效果要好,因为都是同一模式的分词,分出来的词应该都会存在于大型语料库中。实验证明思路是对的,最后结果是只有60几个词不在词向量里,其中大部分为名词,还有...原创 2018-06-01 15:51:08 · 4692 阅读 · 0 评论 -
基于densenet的im2txt实现(tensorflow)
系统环境:python3.6, tensorflow1.4.0, ubuntu摘要:im2txt用于将图像转为文字描述。在原版的im2txt中,使用inceptionV3 对图像进行压缩编码,然后使用lstm进行decode,得到文字描述。本次实验有所改进,采用17年的新网络densenet替代V3,需要更改部份代码。另外在实验方法上,没有用bazel也不是在python2.7运行,所以更改...原创 2018-08-06 14:36:04 · 1546 阅读 · 0 评论