- 博客(3)
- 资源 (2)
- 收藏
- 关注
原创 Ubuntu 一些大数据挖掘与机器学习工具安装
UMlet UMLet是开源的UML建模工具。ubuntu下安装:sudo apt-get install umlet打开界面umlet
2017-06-26 09:35:04 980
原创 Dropout
深度学习中的过拟合问题表现:在训练集上Loss和Accuracy都表现很好,而在测试集上一塌糊涂,训练模型基本上没有什么用处。 过拟合产生原因:处理的是样本量较小,而DNN超强的拟合能力,所以很容易造成过拟合的情况出现。【文献5】另外,比如在文本分类上,dropout效果提升有限,分析原因可能是Reuters-RCV1数据量足够大,过拟合并不是模型的主要问题【文献1】怎么判断是欠拟合还是过拟合?模
2017-06-02 11:26:13 757
原创 离群点(孤立点、异常值)检测方法
本文介绍了离群点(孤立点)检测的常见方法,以及应用各种算法时需要注意的问题。离群点是什么?异常对象被称作离群点。异常检测也称偏差检测和例外挖掘。孤立点是一个明显偏离与其他数据点的对象,它就像是由一个完全不同的机制生成的数据点一样。离群点检测是数据挖掘中重要的一部分,它的任务是发现与大部分其他对象显著不同的对象。大部分数据挖掘方法都将这种差异信息视为噪声而丢弃,然而在一些应用中,罕见的数据可能蕴含着更
2017-06-01 09:49:45 34783 4
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人