- 博客(4)
- 资源 (2)
- 收藏
- 关注
原创 self-ensemble label filtering
self-ensemble label filtering自集成标签滤波模型将噪声标签剔除出来,仅对干净的数据训练。剔除数据主要思路:模型在训练时,对于那些噪声标签的样本的预测值常常飘忽不定(文章是这么指出的,准备做复现的时候试一试),因此采用信号处理中的滤波,而实现的方法是对模型求均值。Model ensemble:在训练过程中对模型的参数进行移动平均,当训练数据更新normal model参数时,通过权重的指数移动平均来维护teacher model,同时利用正则项来令两个model尽量保持
2021-01-17 21:12:45 955 1
原创 多文档的抽取式自动文本摘要
1.抽取式自动文本摘要本文自动文本摘要实现的依据就是词频统计。文章是由句子组成的,文章的信息都包含在句子中,有些句子包含的信息多,有些句子包含的信息少。句子的信息量用"关键词"来衡量。如果包含的关键词越多,就说明这个句子越重要。"自动摘要"就是要找出那些包含信息最多的句子,也就是包含关键字最多的句子。而通过统计句子中关键字的频率的大小,进而进行排序,通过对排序的词频列表对文档中句子逐个进行打分,进而把打分高的句子找出来,就是我们要的摘要。2.原理这种方法最早出自The Automatic
2020-12-11 15:25:56 3373 3
原创 NoisyLearning---Divide Mix
Divide Mix关键点1:混合高斯建模,将labeled的样本集和unlabeled的样本集区分开;关键点2:半监督学习;关键点3:独立网络模型;GMM将一件事物的数学特征用曲线表述出来后再用若干基于高斯(正态分布)概率密度函数行程的模型。找到一个合适的高斯分布,确定高斯分布两个参数,即μ和∑,使得这个高斯分布能够产生本组样本的可能性尽可能大,就形成了拟合样本数据这一说。GMM也被称为一种聚类方法,我是对比机器学习算法K-Means去理解的。GMMK-Means
2020-09-07 14:43:59 679 2
原创 Noisy label learning
Noisy Label Learning1.f’create_noisy_data’include cuda :numpy, random, matplotlib, pandas, tensorflow, os, sklearnFunctions:class cluster_data_preprocess:visualize_data: showing the distribution of the points we gennernateget_centroids: with the
2020-08-09 09:50:06 648
tf2.x_resnet50_pretrained_model.zip
2020-09-06
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人