机器学习
weixin_38313113
这个作者很懒,什么都没留下…
展开
-
机器学习中的Bias(偏差),Error(误差),和Variance(方差)的区别和联系
机器学习中的Bias(偏差),Error(误差),和Variance(方差)有什么区别和联系? 参见 https://www.zhihu.com/question/27068705 误差在分类任务中,通常把错分的样本数占样本总数的比例称为错误率(error rate)。比如m个样本有a个预测错了,错误率就是a/m;与错误率相对的有精度(accuracy),或者说正确率,数...转载 2019-03-24 15:20:43 · 2328 阅读 · 0 评论 -
样本选择的大致方法(小总结)
留出法即按照一定比例留出测试样本,一般来说测试集与训练集互斥交叉验证法k折交叉验证将样本划分为K等份,每次留一份作为测试,训练K个学习器,取测试结果的平均值k折K次在 k折交叉验证的基础上重复K次(每次都是随机划分)。相当于进行的k*k次训练和测试自助法通常用于样本规模较小时从样本中随机有放回取N个样本作为训练集,最后将从未取到过的样本做测试集。N趋于无穷时,训练集约占总样本...转载 2019-07-08 13:21:50 · 1388 阅读 · 0 评论 -
主动学习(Active Learning)
主动学习简介在某些情况下,没有类标签的数据相当丰富而有类标签的数据相当稀少,并且人工对数据进行标记的成本又相当高昂。在这种情况下,我们可以让学习算法主动地提出要对哪些数据进行标注,之后我们要将这些数据送到专家那里让他们进行标注,再将这些数据加入到训练样本集中对算法进行训练。这一过程叫做主动学习。主动学习方法一般可以分为两部分: 学习引擎和选择引擎。学习引擎维护一个基准分类器,并使用监...转载 2019-07-05 15:02:17 · 628 阅读 · 0 评论 -
聚类的方法(层次聚类,K-means聚类)
所谓聚类,就是将相似的事物聚集在一 起,而将不相似的事物划分到不同的类别的过程,是数据分析之中十分重要的一种手段。比如古典生物学之中,人们通过物种的形貌特征将其分门别类,可以说就是 一种朴素的人工聚类。如此,我们就可以将世界上纷繁复杂的信息,简化为少数方便人们理解的类别,可以说是人类认知这个世界的最基本方式之一。在数据分析的术语之中,聚类和分类是两种技术。分类是指我们已经知道了事物的类别,需要...转载 2019-07-23 15:54:59 · 946 阅读 · 0 评论 -
如何将科技论文转化为精彩演讲? 科研人员必备能力!
如何将科技论文转化为精彩演讲?很多中国学生在科技论文写作方面经过导师指点和长期训练后可以得到明显提升和改善.但是由于文化和环境限制,很多学生在学术演讲方面却缺乏足够的练习。好的演讲技巧是一个成功科研人员必备能力之一。我们在学校和社会上将不断需要进行学术、工作和公众演讲。如果我们不能将自己的想法有效地进行展示,我们的研究成果便不能被认可。演讲能力是可以通过不断重复的练习而提高的...转载 2019-08-05 16:53:37 · 253 阅读 · 0 评论 -
核方法(kernel method)的主要思想
kernel method是针对低维线性不可分而提出的一种解决方法,在PRML中有一章节的介绍,对其理解,也是迭代更进的过程。简单来说,kernel method是一种低维和高维特征空间映射的方法,利用低维内积的函数来表征高维内积,即高维的内积用低维内积的函数来表示,这个低维内积的函数就是kernel function。首先,说明kernel method的示例说到机器学习中的核方法(K...原创 2019-08-07 11:26:27 · 3111 阅读 · 0 评论