![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
nlp
youzinan007
这个作者很懒,什么都没留下…
展开
-
NER文献阅读整理
1)《Learning Named Entity Tagger using Domain-Specific Dictionary》 提出AutoNER模型,主要创新点在于预测关联关系与类别,由于边界判错往往不会影响内部之间的关系,能够减小远程监督噪声;其次修改传统的字典匹配方式,将部分高质量短语设置为unknown,并结合数据裁减字典。 比较有启发性的是预测关联关系与类别结合。 2)《BOND: BERT-Assisted Open-Domain Named Entity Recognition wi原创 2020-09-22 16:00:11 · 770 阅读 · 4 评论 -
word2vector
这个博主的系列讲得很细: https://www.cnblogs.com/Determined22/p/5804455.html 中科院大神导读:《How to Generate a Good Word Embedding?》导读 http://licstar.net/archives/620 最容易想到的对文字处理方法就是对所有词进行one-hot编码,但这样一是矩阵的维度惠特比特别的大...原创 2018-10-15 23:52:27 · 457 阅读 · 0 评论 -
kaldi安装
在./tool目录下输入make,开始编译,输入make -j 4命令可以加快速度(多核并行处理)。 之后切换到./src目录下,输入./configure进行配置,然后输入make depend,完成之后输入make进行编译。当然这个过程也可以并行处理加速,输入make -j 4。经过漫长的编译过程以后,就安装完毕了。 若出现报错,特别是openfst等压缩包非常容易出现问题(因网络原因...原创 2018-10-19 10:47:02 · 495 阅读 · 0 评论 -
项目接手
一 ES库的使用 ES库学习 https://www.jianshu.com/p/e8ee319a238d (一)数据转换格式 1:sys.argv 是获取运行python文件的时候命令行参数,且以list形式存储参数 2:xlrd.open_workbook打开文件 3:sheet_by_index 获取某一个表单 str.replace(old, new[, max]) ol...原创 2018-10-29 10:36:56 · 200 阅读 · 0 评论 -
李宏毅学习记录1——基础知识
1:零填充就是对输入量在边界上用零进行填充。可以控制输出数据体的空间尺寸(最常用的是用来保持输入数据体在空间上的尺寸,这样输入和输出的宽高都相等)。 2:各种池化的区别:https://blog.csdn.net/JIEJINQUANIL/article/details/50042791 mean-pooling,即对邻域内特征点只求平均 max-pooling,即对邻域内特征点取最大 ...转载 2018-11-04 16:21:16 · 204 阅读 · 0 评论 -
s2s
chatbot https://www.jianshu.com/p/3c6f1e32e128 s2s: https://blog.csdn.net/xbinworld/article/details/54605408 tensorflow的seq2seq: https://blog.csdn.net/leadai/article/details/78809788原创 2018-12-13 16:17:10 · 558 阅读 · 0 评论