数据分类
我冬
这个作者很懒,什么都没留下…
展开
-
SOM自组织竞争神经网络的数据分类神经元数目的问题
假设样本类数目M为96,竞争层神经元的个数为100个(10*10,疑问:可不可以8*12?)。关于神经元个数的看法:神经元多一些反而好一些,这样让那些“类内疏散的个别样本”尽可能被一个竞争神经元给竞争到,于是,这样就可以保证一个疏松的大类有2至多个神经元竞争到。总之,类内相对疏散的类数越多,需要的神经元个数N(N>M)越多。...原创 2018-05-07 15:58:50 · 2097 阅读 · 1 评论 -
data augmetation
基于机器学习的无监督数据增强时,增强几倍,在测试的时候通常使用相应倍数的batch进行测试,因为batch小的话很可能结果不稳定,因为增强的时候:一个图片分成两个或者更多个子图片,这些图片的标签都是一样的,在训练过程中,一旦没有训练得到或者在训练效果不佳的情况下,在测试的时候就会造成增强后的子图像分类要么全正确,要么全部错误。因此通过提高测试的batch size 来提升测试结果的稳定性。...原创 2019-05-08 16:32:14 · 162 阅读 · 0 评论 -
Improved Techniques for Training GANs中文部分翻译版
Improved Techniques for Training GANs中文翻译版3 关于GAN训练的收敛性训练GANs就是要在两个不合作的游戏玩家之间找到一个NASH平衡。每一个玩家都希望自己的损失最小化,J (D)(θ(D); θ(G)) for the discriminator andJ (G)(θ(D); θ(G)) for the generator. 一个纳西平衡就是一个关...翻译 2018-12-27 16:21:43 · 826 阅读 · 1 评论 -
基于sklearn的常用分类任务指标Python实现
基于sklearn的常用分类任务指标Python实现一、摘要分类任务常用指标包含混淆矩阵、每类分类精度、平均分类精度、总体分类精度、f1-score等。 Python的sklearn.metrics 模块覆盖了分类任务中大部分常用的验证指标, 本文选择其中几种评价指标展示代码片段,供读者使用。 基于tensorflow-1.0与mnist数据集做demo展示并列举实验结果。 文末附有skl...转载 2018-11-05 11:40:25 · 920 阅读 · 0 评论 -
基于sklearn的常用分类任务指标Python实现
基于sklearn的常用分类任务指标Python实现一、摘要分类任务常用指标包含混淆矩阵、每类分类精度、平均分类精度、总体分类精度、f1-score等。 Python的sklearn.metrics 模块覆盖了分类任务中大部分常用的验证指标, 本文选择其中几种评价指标展示代码片段,供读者使用。 基于tensorflow-1.0与mnist数据集做demo展示并列举实验结果。 文末附有skl...转载 2018-11-05 11:37:53 · 639 阅读 · 0 评论 -
关于lightGBM参数以及性能评价
中文文档:http://lightgbm.apachecn.org/cn/latest/Parameters.html#调用sklearn库中的指标求解from sklearn import metricsfrom sklearn.metrics import precision_recall_curvefrom sklearn.metrics import average_preci...原创 2018-10-26 20:10:32 · 3282 阅读 · 0 评论 -
迁移学习算法之TrAdaBoost
转自https://www.cnblogs.com/bonelee/p/8921579.html TradaBoost算法由来已久,具体算法可以参考作者的原始文章,Boosting For Transfer Learning。1.问题定义 传统的机器学习的模型都是建立在训练数据和测试数据服从相同的数据分布的基础上。典型的比如有监督学习,我们可以在训练数据上面训练得到一...转载 2018-09-14 11:17:42 · 3811 阅读 · 0 评论 -
时间序列聚类
时间序列聚类通常分为三类:1、依时间点聚类:时间点上的相似度,欧氏距离2、依形状聚类:空间上的相似度,DTW3、依变化聚类:数据生成过程中的相似度,基于概率的距离,GMM,ARMA,mixture数据简化方面,PAA是一个常用语时间序列的数据变换,其在保证时间序列形态的同时,还保证了计算效率。在实际应用的时候,我们通常会想个办法自动算出PAA要分割的片段个数,不然每次都是通过随机喊个数将是一件特别...转载 2018-05-23 17:50:52 · 6408 阅读 · 2 评论 -
过拟合问题
过拟合问题不仅仅是因为数据集小的原因,这里的数据集小:表现在两方面,一方面是数据集的两小,另一方面是数据集的样本不均匀,不够完善,也即,如果一定程度上,一个完备的数据集比一个不完善的数据集训练出来的网络更为理想。因为如果训练数据集都是很规整的实例,训练出来的网络将会呈现过拟合状态,在预测的时候,一切都是未知的,对于变化(变形,变异)比较大的实例来说,预测结果将会出现错误。此篇小记里面只是讲到了数据...原创 2018-05-16 17:37:27 · 325 阅读 · 0 评论 -
性能评估
文章转自:anzizhuas://www.cnblogs.com/xiaoxuebiye/p/7777756.html目标函数:keras文档: http://keras.io/objectives/mean_squared_error/mse 均方误差,常用的目标函数,公式为((y_pred-y_true)**2).mean() mean_absolute...转载 2019-07-24 16:58:59 · 375 阅读 · 0 评论