![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
算法
文章平均质量分 55
想努力的人
世界很好
展开
-
orin nx 安装paddlespeech记录
需要安装soxbindings包,这个包需要安装底层的c++库,ok接下来就可以正确运行,其他的包正常安装即可。Deepstream版本。Tensorrt版本。原创 2024-02-06 09:29:23 · 1085 阅读 · 0 评论 -
deepstream python yolov5使用记录
deepstream使用python代码跑yolov5进行推理原创 2022-08-23 12:01:09 · 1728 阅读 · 0 评论 -
学习知识记录
1、nnlm神经网络语言模型:https://blog.csdn.net/hx14301009/article/details/803454492、Word2vec的skip gram模型输入是 中心词和背景词https://blog.csdn.net/weixin_41843918/article/details/90312339层级的softmax:本质是将N分类问题转换成logN(底数为2)次的二分类负采样:更新部分权重,其他的权重固定3、batchnormal..原创 2020-07-29 09:44:38 · 118 阅读 · 0 评论 -
算法刷题
记录一下比较的刷题网站:七月在线:https://www.julyedu.com/question/big/kp_id/2/ques_id/2134编码之法:https://wizardforcel.gitbooks.io/the-art-of-programming-by-july/content/02.03.html...原创 2020-04-29 18:55:19 · 160 阅读 · 0 评论 -
文本分类 tricks
tricks模型训练好后,分类训练集和验证集中以很高的置信度做出错误决策的样本,然后去做这些bad cases的分析,如果发现错误标注有很强的规律性,则直接写一个脚本纠正(只要确保纠正后的标注正确率比纠正前明显高就行),如果没有什么规律,但是发现模型高置信度做错这些样本大部门都是标注错误的话,就直接删除这些样本,...原创 2020-04-15 17:07:21 · 337 阅读 · 0 评论 -
机器学习中的正则化(Regularization)
转自:https://www.jianshu.com/p/569efedf6985文中部分图片摘自吴恩达deeplearning课程的作业,代码及课件在我的github:DeepLearning 课件及作业关于本篇正则化的具体路径是:正则化作业正则化的概念及原因简单来说,正则化是一种为了减小测试误差的行为(有时候会增加训练误差)。我们在构造机器学习模型时,最终目的是让模型在...转载 2020-03-20 17:39:04 · 590 阅读 · 0 评论 -
一行代码自动调参,支持模型压缩指定大小,Facebook升级FastText
参与:一鸣、亚洲FastText 作为一款使用简单、运行快速的自然语言处理工具,获得了很多研究者和开发者的喜爱。美中不足的是,FastText 之前没有自动调参的功能。近日,Facebook 更新了这一工具,用户只需要在命令行增加一句代码,工具可以根据用户数据自动调整超参数,使得模型在指定标签或整体数据上达到最佳效果。同时,其可以进行模型压缩,并自动在压缩过程中调整参数。即使模型足够小,也依...转载 2020-03-19 09:37:27 · 632 阅读 · 0 评论 -
机器学习笔记
1、机器学习为什么要打乱数据机器学习中的训练是用已知的输入数据来修改模型中的参数,以将其泛化到新的数据上。假设输入数据大致可以分为两类。若不将输入数据打乱,则在训练时模型的参数首先用于拟合第一种类型的数据,而当大量的第一类数据连续输入训练时,极易造成参数在第一类数据上过拟合。当这一任务完成后,产生的模型显然不适用与第二类数据,此时开始连续输入第二类数据,这时模型又要尽力逼近第二类数据,造成...原创 2020-03-11 19:35:24 · 183 阅读 · 0 评论 -
用半监督算法做文本分类(自训练)
转自:https://www.cnblogs.com/lookfor404/p/9692669.html转载 2020-02-14 18:18:05 · 1561 阅读 · 0 评论 -
nlp学习领悟
数据理解:长句子相对于短句子,存在一个特性,长句子比短句子有更多的单词,因此长句子在保持原有的类别标签的情况,能吸收更多的噪声。原创 2020-01-03 14:08:21 · 135 阅读 · 0 评论 -
自然语言处理-错字识别(基于Python)kenlm、pycorrector
转载请注明出处:https://blog.csdn.net/HHTNANn元分词法参见:https://blog.csdn.net/HHTNAN/article/details/62046652关于kenlm统计语言模型:https://blog.csdn.net/HHTNAN/article/details/84231733中文文本纠错划分中文文本纠错任务,常见错误类型包括:谐音...转载 2019-11-04 14:29:02 · 2462 阅读 · 0 评论 -
机器学习“判定模型”和“生成模型”有什么区别?
判别式模型举例:要确定一个羊是山羊还是绵羊,用判别模型的方法是从历史数据中学习到模型,然后通过提取这只羊的特征来预测出这只羊是山羊的概率,是绵羊的概率。生成式模型举例:利用生成模型是根据山羊的特征首先学习出一个山羊的模型,然后根据绵羊的特征学习出一个绵羊的模型,然后从这只羊中提取特征,放到山羊模型中看概率是多少,在放到绵羊模型中看概率是多少,哪个大就是哪个。细细品味上面的...转载 2019-10-24 19:17:09 · 220 阅读 · 0 评论 -
机器学习-svm
总结:目标函数:M = 2 / ||w||找到“支持向量”的两个超平面,使得两超平面之间的距离最大(求取M最大)其中y(wx+b)>=1,因为y的取值是1和-1,而(wx+b)的取值是负无穷到-1和正无穷到1乘积必大于等于1.求取的参数:W和b其中,W是向量核函数将特征由低维空间映射到高维空间(线性核、多项式核、高斯核、拉普拉斯核、Sigmoid核)使用目标函数时,有时会发生过拟合。此时常常...转载 2018-03-02 18:03:18 · 293 阅读 · 0 评论 -
机器学习-KNN
机器学习算法-K最近邻从原理到实现Posted on 2015-05-21 20:34 | In ML | 0 comment | views : 3195源码:https://github.com/csuldw/MachineLearning/tree/master/KNN决策树和基于规则的分类器都是积极学习方法(eager learner)的例子,因为一旦训练数据可用,...转载 2018-03-02 11:12:50 · 267 阅读 · 0 评论 -
simhash去重算法实践
自己实践simhash算法的几点经验:1 数据已处理,正则表达式去除各种转义符号2 将文本中的数字和字母等去除3 分词后去除停顿词步骤,1 文本预处理代码步骤原创 2017-12-20 20:52:17 · 493 阅读 · 0 评论