自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Potential

不要低估自己的潜能

  • 博客(6)
  • 收藏
  • 关注

原创 史纪

顺 不妄喜; 逆 不遑馁; 安 不奢逸; 危 不惊惧; 胸有惊雷而面如平湖者, 可拜上将军也。 大意:在顺境中,不轻狂,不沾沾自喜;在逆境中,不惶恐,不气馁;在安逸的环境中,不骄奢淫逸;在危机四伏时,仍能不害怕;胸中有万千事情,而仍然能不动声色的人必能成大事。智者千虑,必有一失; 愚者千虑,必有一得。 大意:集思广益;努力思考观之上古,验之当世, 参以人事,察盛

2017-10-13 11:51:44 331

原创 过拟合问题

过拟合定义在给定的一个假设空间HH,一个假设属于hh,如果存在其他的假设h,h^{,},属于HH,使得在训练样例上hh的错误率比h,h^{,}小,但在整个实例分布上h,h^{,}比hh错误率小,那么说假设hh过度拟合了训练数据。 通俗一点说,就是在提升模型(上面所说的假设)在训练数据上的表现,在测试集上的表现反而变差。或者说将不仅学习到了数据的一般规律,还将非一般规律(数据的特异点或者离群点)学习

2017-10-09 17:46:02 1038

原创 特征选择概述

维基百科定义:在机器学习和统计学中,特征选择(英语:feature selection)也被称为变量选择、属性选择或变量子集选择。 它是指:为了构建模型而选择相关特征(即属性、指标)子集的过程。特征选择的目标是寻找最优特征子集。特征选择能剔除不相关(irrelevant)或冗余(redundant )的特征,从而达到减少特征个数,提高模型精确度,减少运行时间的目的。另一方面,选取出真正相关的特征简化

2017-10-09 15:39:58 1085

原创 计算机专业导论

一 思维与系统 101为什么学?计算思维,理论思维,实验思维102计算思维0和1,程序,递归 算法和系统 社会自然的计算化 计算求解的自然化 业务计算--模型--系统 语言--人到计算机--编译器 机机--协议--编解码器 数据化和网络化思维103 怎样学习这么课程?3.1 只是构建次序 社会自然现象-逻辑-二进制-电路-集成电路-计算机 在思维指导下掌握知识技能,然后通过具体的训练形成自己的能力1

2017-10-07 20:57:49 2062

转载 spark开始

第一章spark是什么相对于Hadoop Mapreduce的优点在于:速度更快,丰富的API,支持交互式查询,流式计算,机器学习,图计算等 假设:我们假设你已经有了关于数据存储的解决方案,所以不会讲到如何搭建一个数据存储系统 Spark 项目包含多个紧密集成的组件,可以像在平常软件项目中使用程序库那样,组合使用这些的组件。 认识组件: spark CoreSpark Core 实现了 Sp

2017-10-04 23:42:05 243

原创 KNN学习及实现

目录:一、KNNK紧邻算法 三个基本要素: 距离的度量 k值的选择 分类决策规则 KNN优点 简单,易于理解,易于实现,无需估计参数,无需训练 特别适合于多分类问题(multi-modal,对象具有多个类别标签), kNN比SVM的表现要好。 适合对稀有事件进行分类 KNN缺点 该算法在分类时有个主要的不足是,当样本不平衡时,如一个类的样本容量很大,而其他类样本容量很小时,有可能导致当输入一个

2017-10-04 23:16:39 430

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除