nlp
youzinan007
这个作者很懒,什么都没留下…
展开
-
NER文献阅读整理
1)《Learning Named Entity Tagger using Domain-Specific Dictionary》提出AutoNER模型,主要创新点在于预测关联关系与类别,由于边界判错往往不会影响内部之间的关系,能够减小远程监督噪声;其次修改传统的字典匹配方式,将部分高质量短语设置为unknown,并结合数据裁减字典。比较有启发性的是预测关联关系与类别结合。2)《BOND: BERT-Assisted Open-Domain Named Entity Recognition wi原创 2020-09-22 16:00:11 · 785 阅读 · 4 评论 -
word2vector
这个博主的系列讲得很细:https://www.cnblogs.com/Determined22/p/5804455.html中科院大神导读:《How to Generate a Good Word Embedding?》导读http://licstar.net/archives/620最容易想到的对文字处理方法就是对所有词进行one-hot编码,但这样一是矩阵的维度惠特比特别的大...原创 2018-10-15 23:52:27 · 462 阅读 · 0 评论 -
kaldi安装
在./tool目录下输入make,开始编译,输入make -j 4命令可以加快速度(多核并行处理)。 之后切换到./src目录下,输入./configure进行配置,然后输入make depend,完成之后输入make进行编译。当然这个过程也可以并行处理加速,输入make -j 4。经过漫长的编译过程以后,就安装完毕了。 若出现报错,特别是openfst等压缩包非常容易出现问题(因网络原因...原创 2018-10-19 10:47:02 · 509 阅读 · 0 评论 -
项目接手
一 ES库的使用ES库学习https://www.jianshu.com/p/e8ee319a238d(一)数据转换格式1:sys.argv 是获取运行python文件的时候命令行参数,且以list形式存储参数2:xlrd.open_workbook打开文件3:sheet_by_index 获取某一个表单str.replace(old, new[, max])ol...原创 2018-10-29 10:36:56 · 204 阅读 · 0 评论 -
李宏毅学习记录1——基础知识
1:零填充就是对输入量在边界上用零进行填充。可以控制输出数据体的空间尺寸(最常用的是用来保持输入数据体在空间上的尺寸,这样输入和输出的宽高都相等)。2:各种池化的区别:https://blog.csdn.net/JIEJINQUANIL/article/details/50042791 mean-pooling,即对邻域内特征点只求平均max-pooling,即对邻域内特征点取最大 ...转载 2018-11-04 16:21:16 · 212 阅读 · 0 评论 -
s2s
chatbothttps://www.jianshu.com/p/3c6f1e32e128s2s:https://blog.csdn.net/xbinworld/article/details/54605408tensorflow的seq2seq:https://blog.csdn.net/leadai/article/details/78809788原创 2018-12-13 16:17:10 · 576 阅读 · 0 评论