- 博客(3)
- 资源 (6)
- 问答 (3)
- 收藏
- 关注
原创 K均值算法
K均值算法,即K-means,主要分为两步:确定簇标记移动簇中心输入:K(簇的个数),训练集{x1,x2,…xm}首先,初始化K个簇中心点 μ1,μ2,…μK;Repeat{确定各样本点簇标记for i=1 to mxi的簇标记:= 与xi距离最近的簇中心的标记根据当前簇标记移动簇中心点for k=1 to Kμk:=簇k中样本点的平均向量}...
2018-10-18 09:55:32 1198
原创 如何得到一个较好的机器学习系统
牢记“It’s not who has the best algorithm that wins.It’s who has the most data.”要想得到高效的系统:首先,特征一定要选好;其次,模型复杂度要合适。这一点可以降低偏差(bias),即防止欠拟合。保证 J train(θ)比较小。最后,训练数据要充足。这一点可降低方差(variance),防止过拟合。保证J test...
2018-10-13 10:31:41 499
原创 统计学习三要素个人理解
模型模型就是所要学习的函数或分布,用以表征输出与输入之间的联系。策略按照什么准则(损失函数,风险函数,经验风险函数=>结构风险函数)选择最好的模型。算法最优化问题求解方法,如何使损失最小进而使模型最好。...
2018-10-12 15:31:23 720
PyQt4安装包
2017-06-27
Galago开源搜索引擎
2016-05-25
磁盘分区助手PA5.2_Portable
2015-06-02
概率问题为什么 0<=P(X=a|Y=b)<=P(X=a)<=1 不正确??
2017-03-28
Java中接口是Object类的子类吗?
2016-04-27
哪位来解释下GitHub 网站怎么用?
2016-04-13
TA创建的收藏夹 TA关注的收藏夹
TA关注的人