- 博客(17)
- 收藏
- 关注
原创 NER文献阅读整理
1)《Learning Named Entity Tagger using Domain-Specific Dictionary》提出AutoNER模型,主要创新点在于预测关联关系与类别,由于边界判错往往不会影响内部之间的关系,能够减小远程监督噪声;其次修改传统的字典匹配方式,将部分高质量短语设置为unknown,并结合数据裁减字典。比较有启发性的是预测关联关系与类别结合。2)《BOND: BERT-Assisted Open-Domain Named Entity Recognition wi
2020-09-22 16:00:11 784 4
原创 s2s
chatbothttps://www.jianshu.com/p/3c6f1e32e128s2s:https://blog.csdn.net/xbinworld/article/details/54605408tensorflow的seq2seq:https://blog.csdn.net/leadai/article/details/78809788
2018-12-13 16:17:10 575
转载 李宏毅学习记录1——基础知识
1:零填充就是对输入量在边界上用零进行填充。可以控制输出数据体的空间尺寸(最常用的是用来保持输入数据体在空间上的尺寸,这样输入和输出的宽高都相等)。2:各种池化的区别:https://blog.csdn.net/JIEJINQUANIL/article/details/50042791 mean-pooling,即对邻域内特征点只求平均max-pooling,即对邻域内特征点取最大 ...
2018-11-04 16:21:16 212
原创 项目接手
一 ES库的使用ES库学习https://www.jianshu.com/p/e8ee319a238d(一)数据转换格式1:sys.argv 是获取运行python文件的时候命令行参数,且以list形式存储参数2:xlrd.open_workbook打开文件3:sheet_by_index 获取某一个表单str.replace(old, new[, max])ol...
2018-10-29 10:36:56 204
原创 配置asr接口
1 查看操作系统 uname -a2 安装anacondash +绝对路径名3 下载gcchttp://ftp.gnu.org/gnu/gcc/gcc-4.5.1/ 父节点查找
2018-10-24 19:21:02 708
原创 机器学习lr复习点
lr主要推导https://blog.csdn.net/ligang_csdn/article/details/53838743损失函数:为何不用最小二乘法是否要用最小二乘法取决于在所有未知数中的残差是否为线性最大似然将概率密度估计问题转化为参数估计问题,极大似然估计就是一种参数估计方法随机梯度下降代码https://www.cnblogs.com/21207-iH...
2018-10-22 16:18:18 159
原创 kaldi安装
在./tool目录下输入make,开始编译,输入make -j 4命令可以加快速度(多核并行处理)。 之后切换到./src目录下,输入./configure进行配置,然后输入make depend,完成之后输入make进行编译。当然这个过程也可以并行处理加速,输入make -j 4。经过漫长的编译过程以后,就安装完毕了。 若出现报错,特别是openfst等压缩包非常容易出现问题(因网络原因...
2018-10-19 10:47:02 508
原创 word2vector
这个博主的系列讲得很细:https://www.cnblogs.com/Determined22/p/5804455.html中科院大神导读:《How to Generate a Good Word Embedding?》导读http://licstar.net/archives/620最容易想到的对文字处理方法就是对所有词进行one-hot编码,但这样一是矩阵的维度惠特比特别的大...
2018-10-15 23:52:27 462
原创 d-vector声纹识别基础
声纹识别之GMM-UBM系统框架简介https://blog.csdn.net/weixin_38206214/article/details/81084456声纹识别之I-Vectorhttps://blog.csdn.net/weixin_38206214/article/details/81096092d-vectorDNN训练好后,提取每一帧语音的Filterbank E...
2018-10-08 15:23:56 8393
原创 no module named req
错误:Traceback (most recent call last): File "dingdang.py", line 11, in <module> from client import tts File "/home/youzinan/zhou/robot/dingdang-robot-master/client/tts.py", line 32, in ...
2018-09-27 14:35:02 1157
原创 ubuntu16.04启动问题
问题描述:ubuntu输入登录密码后卡在背景画面,ctrl+alt+f1进入非图形界面有时也会卡住,无法进入访客会话 由于刚配置了一个星期的环境不能重装,所以所有自动修复的方案直接放弃,差了好多个解决方案记录如下首先明确的思路为非图形界面操作解决尝试方案1 sudo dpkg --configure -a无法解决 尝试方案2解决成功sudo rm /var/lib/...
2018-09-27 09:38:33 429
转载 xgboost基本原理
https://juejin.im/post/5a13c9a8f265da43333e0648GBDT(Gradient Boosting Decision Tree)基本原理GBDT相对于经典的决策树,算是一种比较成熟而且可以实际应用的决策树算法了。首先我们要了解到,DBDT是一种回归树分类树在每一次分支的时候,穷举每一个特征的每一个阈值,然后按照大于或者小于阈值的方式将其相互分开。这就是分类树...
2018-04-17 10:43:10 474
原创 3月26今日论文Text Understanding with the Attention Sum Reader Network
https://arxiv.org/pdf/1603.01547.pdf变化点:我们提出了一个新的简单模型,它使用注意力模型直接从上下文中选择答案,而不像通常在类似模型中那样使用文档中的单词混合表示计算答案。实现步骤step 1 通过一层Embedding层将document和query中的word分别映射成向量。step 2 用一个单层双向GRU来encode document,得到contex...
2018-03-26 11:29:58 331
原创 决策树的理解
决策树(decision tree)是一个树结构(可以是二叉树或非二叉树)。其每个非叶节点表示一个特征属性上的测试,每个分支代表这个特征属性在某个值域上的输出,而每个叶节点存放一个类别。使用决策树进行决策的过程就是从根节点开始,测试待分类项中相应的特征属性,并按照其值选择输出分支,直到到达叶子节点,将叶子节点存放的类别作为决策结果。http://www.cnblogs.com/leoo2sk/ar...
2018-03-26 09:28:49 553
原创 3月22日论文Scaling Up the Accuracy of Naive-Bayes Classiers: a Decision-Tree Hybrid;决策树混合提高朴素贝叶斯分类模型准确度
http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.462.9093&rep=rep1&type=pdf综述性论文,讲述基本概念,介绍使用实验来验证可以达成提高多大的提高。目前决策树已十分成熟,业内论文主要也针对新的应用场景,以及多模型融合。 朴素贝叶斯算法在很多分类器项目上表现出惊异的准确性,即使在依赖的...
2018-03-22 15:21:55 721
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人