- 博客(6)
- 收藏
- 关注
原创 史纪
顺 不妄喜; 逆 不遑馁; 安 不奢逸; 危 不惊惧; 胸有惊雷而面如平湖者, 可拜上将军也。 大意:在顺境中,不轻狂,不沾沾自喜;在逆境中,不惶恐,不气馁;在安逸的环境中,不骄奢淫逸;在危机四伏时,仍能不害怕;胸中有万千事情,而仍然能不动声色的人必能成大事。智者千虑,必有一失; 愚者千虑,必有一得。 大意:集思广益;努力思考观之上古,验之当世, 参以人事,察盛
2017-10-13 11:51:44 331
原创 过拟合问题
过拟合定义在给定的一个假设空间HH,一个假设属于hh,如果存在其他的假设h,h^{,},属于HH,使得在训练样例上hh的错误率比h,h^{,}小,但在整个实例分布上h,h^{,}比hh错误率小,那么说假设hh过度拟合了训练数据。 通俗一点说,就是在提升模型(上面所说的假设)在训练数据上的表现,在测试集上的表现反而变差。或者说将不仅学习到了数据的一般规律,还将非一般规律(数据的特异点或者离群点)学习
2017-10-09 17:46:02 1038
原创 特征选择概述
维基百科定义:在机器学习和统计学中,特征选择(英语:feature selection)也被称为变量选择、属性选择或变量子集选择。 它是指:为了构建模型而选择相关特征(即属性、指标)子集的过程。特征选择的目标是寻找最优特征子集。特征选择能剔除不相关(irrelevant)或冗余(redundant )的特征,从而达到减少特征个数,提高模型精确度,减少运行时间的目的。另一方面,选取出真正相关的特征简化
2017-10-09 15:39:58 1085
原创 计算机专业导论
一 思维与系统 101为什么学?计算思维,理论思维,实验思维102计算思维0和1,程序,递归 算法和系统 社会自然的计算化 计算求解的自然化 业务计算--模型--系统 语言--人到计算机--编译器 机机--协议--编解码器 数据化和网络化思维103 怎样学习这么课程?3.1 只是构建次序 社会自然现象-逻辑-二进制-电路-集成电路-计算机 在思维指导下掌握知识技能,然后通过具体的训练形成自己的能力1
2017-10-07 20:57:49 2062
转载 spark开始
第一章spark是什么相对于Hadoop Mapreduce的优点在于:速度更快,丰富的API,支持交互式查询,流式计算,机器学习,图计算等 假设:我们假设你已经有了关于数据存储的解决方案,所以不会讲到如何搭建一个数据存储系统 Spark 项目包含多个紧密集成的组件,可以像在平常软件项目中使用程序库那样,组合使用这些的组件。 认识组件: spark CoreSpark Core 实现了 Sp
2017-10-04 23:42:05 243
原创 KNN学习及实现
目录:一、KNNK紧邻算法 三个基本要素: 距离的度量 k值的选择 分类决策规则 KNN优点 简单,易于理解,易于实现,无需估计参数,无需训练 特别适合于多分类问题(multi-modal,对象具有多个类别标签), kNN比SVM的表现要好。 适合对稀有事件进行分类 KNN缺点 该算法在分类时有个主要的不足是,当样本不平衡时,如一个类的样本容量很大,而其他类样本容量很小时,有可能导致当输入一个
2017-10-04 23:16:39 430
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人