- 博客(3)
- 收藏
- 关注
原创 论文阅读(1)——医疗数据分析
这次分析总结的是这篇论文:《ExactTop-k FeatureSelectionvia `2,0-NormConstraint》 XiaoCai,FeipingNie,HengHuang文章是基于Sparse methods for machine learning。相关的补充资料,可以在这个链接找到:https://www.di.ens.fr/~fbach/Cours_peyresq_
2017-10-22 20:47:42 578
原创 周志华《机器学习》读书笔记(二)
一. 经验误差与过拟合错误率:分类错误的样本数,占样本总数的比例。精度:分类正确的样本数,占样本总数的比例。显然有,错误率+精度=1 恒成立误差:学习器的实际预测输出,与样本的真实输出之间的差异。训练误差/经验误差:学习器在训练集上的误差泛化误差:学习器在新样本上的误差显然我们的目标是得到“泛化误差”尽可能小的学习器,也即在新样本上可以表现得尽可能好的学习器。这
2017-10-11 00:29:37 2958 2
原创 周志华《机器学习》读书笔记(一)
本书前几章讲的都是基本术语,最硬核的数学部分很少,所以比较简单。机器学习的主要内容,是从数据产生模型,再由模型做出相应的判断和预测。比如已经知道某房屋所在街区的其他房屋的价格,通过给这些面积,价格等各异的其他房屋的数据进行分析,产生模型,利用此模型来预测本房屋的市场价格。一. 基本术语对一批西瓜,我们能够观察了解到色泽、根蒂、敲声等特征。比如现在得到的数据如下所示:
2017-10-05 16:25:41 11823
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人