![](https://img-blog.csdnimg.cn/20201014180756923.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
文章平均质量分 73
机器学习
Carlosi
这个作者很懒,什么都没留下…
展开
-
拼写纠错(Spelling Correct)技术方案总结
1 纠错基础知识 1.1 常见错误类型 1.2 纠错组成模块 2 深度学习技术 2.1 FASPell(爱奇艺) 2.1.1 技术方案 2.1.1.1 背景 2.1.1.2 模型结构 2.1.1.3 训练过程 2.1.2 优点和缺点 2.2 SpellGCN (阿里) 2.2.1 技术方案 2.2.1.1 背景 2.2.1.2 模型结构 2.2.1.3 训练过程 2.2原创 2021-09-03 17:06:42 · 1723 阅读 · 0 评论 -
基于pytorch模型剪枝的实现(极大的减少模型计算参数加快模型运行速度)
深度模型剪枝实现以及一些网络优化技巧模型剪枝:Learning Efficient Convolutional Networks Through Network Slimming (ICCV 2017). 基于论文的代码复现以及拓展: 在网络上中加入其它优化方法 最强深度学习优化器Ranger warm up与consine learning rate 为什么使用warmup? label smooth apex混合精度训练 梯度累加 其他网络部署的原创 2021-09-02 16:51:12 · 894 阅读 · 0 评论 -
多GPU训练半精度和单精度问题
125|0%| | 0/1 [00:00<?, ?it/s] 0%| | 0/1 [03:24<?, ?it/s]126|Traceback (most recent call last):127|File "/nfs/volume-826-2/carlos/0830_dector/ja/AA_gector-master/train.py", line 305, in <module>128|args = parser.parse_args()129|Fil...原创 2021-09-02 14:19:07 · 1789 阅读 · 0 评论 -
AllenNLP 用法总结
AllenNLP另外很重要的一点在于,它在torch的model的基础上添加了很多的方法,使得模型更加适用于NLP场景的使用。AllenNLP设计模型的思想在于:输出为dict格式,里面必须包含loss,其余则由我们自行决定。因此输出相比传统的pytorch模型,输出更加的丰富,我们可以把我们任何想要的信息都通过这个字典返回~model.py文件有370多行,大体上需要注意的是__init__ 里要传入vocab与regularizer get_regularization_penal原创 2021-09-01 20:34:06 · 1658 阅读 · 0 评论 -
评价指标汇总--------汇总
在使用机器学习算法过程中,针对不同的问题需要不用的模型评估标准,这里统一汇总。主要以两大类分类与回归分别阐述。一、分类问题混淆矩阵是监督学习中的一种可视化工具,主要用于比较分类结果和实例的真实信息。矩阵中的每一行代表实例的预测类别,每一列代表实例的真实类别。真正(True Positive , TP):被模型预测为正的正样本。假正(False Positive , FP):被模型预测为正的负样本。假负(False Negative , FN):被模型预测为负的正样本。真..原创 2021-09-01 00:52:21 · 453 阅读 · 0 评论 -
Python 个人总结的一些常用函数
数据集 AC错误 BD正确# -*- coding: utf-8 -*-chrome://flags/#extensions-on-chrome-urls问题: Initializing libiomp5.dylib, but found libomp.dylib already initialized.import osos.environ["KMP_DUPLICATE_LIB_OK"]="TRUE"带颜色的字体from colorama import Fore, Ba...原创 2021-09-01 00:22:24 · 669 阅读 · 0 评论 -
日语纠错问题 拼写纠错
目前在做日语纠错任务,主要是为了解决公司query召回率低的问题,目前可行的方案有下面几个:一个是科大讯飞的那个gector模型 ,他主要是利用了bert或者Robert来做特征提取,然后会在最后接上两个全链接网络,分别用来输出每个日语单词纠正的对象可他们本身错误的概率值信息,通过对他们的结果分别求得一个loss值来进行反向梯度传递,不断进行训练以此达到最优值,其中错误数据的是我通过罗马音和编辑距离为一的一些词进行随机的替换构成的,以此来模仿真实地错误数据。未完待续。。另外一个就是根据Be...原创 2021-09-01 00:13:52 · 530 阅读 · 0 评论 -
图论
图的概念图是一种非线性的数据结构,一个图中有两类东西,一种是结点,一种是边.我们用V这个集合来表示节点(vertex),还需要另一个集合来存储所有的边,我们用E来表示(Edge),那么一个图就可以表示为:G=(V,E);带箭头的称为有向图,否则称为无向图.如果一个图的任意两个结点之间有且只有一条边,则称此图为无向完全图,若任意两个结点之间有且只有方向相反的两条边,则称为有向完全图.度是针对结点来说的, 又分为出度和入度,对于有向图来说,出度就是指以这个结点为起始的边的条数(箭头向外),入度则是以这个原创 2021-08-31 13:33:36 · 133 阅读 · 0 评论