自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 Learning Curves and Error Analysis

当我们做监督学习时,有一系列的带有标签的数据,通常我们把它们分成三部分。Training Data,Cross Validation Data,Testing Data.占比通常是60%,20%,20%.确定好具体用哪个算法后,Training Data用来训练算法的参数,Validation Data用来选择具体的模型(比如the degree of polynomial,the paramete

2017-09-02 22:42:58 268

原创 非线性-Logistic(逻辑斯特)回归

关于算法这块,这周看了斯坦福大学Andrew Ng的公开课。还是极力推荐的,每节课10分钟左右,讲的思路清晰,内容丰富,编程作业也很值得去做。(在这里好想吐槽一下国内培训机构七月算法的培训视频呀,根本看不下去。)上课形式是这样滴 编程作业提交是这样滴 Nice work.每次都是一百分也挺有成就感的。每周的编程作业会有一份非常详细的pdf文档解释pdf文档是这样滴 上课也挺搞笑的,很愿意听

2017-08-20 10:53:12 1297

原创 CART构建与剪枝

上周实现了离散变量的决策树的构建(ID3算法),它的做法是每次选取当前最佳的特征来分割数据,并按照该特征所有的可能值来切分。也就是说,如果一个特征有4种取值,那么数据被切分成4份,一旦按某特征切分后,便固定死了,该特征在之后的算法执行过程中将不会再起作用,显然,这种切分方式过于迅速。而此外,ID3算法不能直接处理连续型特征。 再补充一下用ID3算法生成决策树的图例。 我们的例子是李航的《统计学习

2017-08-06 15:40:22 645

原创 分类决策树

什么是分类决策树?分类决策树能用来干什么?举个例子就明白了。 一位母亲要给她女儿介绍对象,于是有了如下对话: 女儿:多大年纪了? 母亲:26。 女儿:长的帅不帅? 母亲:挺帅的。 女儿:收入高不? 母亲:不算很高,中等情况。 女儿:是公务员不? 母亲:是,在税务局上班呢。

2017-07-30 17:25:30 418

原创 基于kd树的KNN算法的实现

记得大三初期,刚从大连理工大学回来,眼巴巴的望着同学各自都有着落了,就我一副“初出茅庐,不谙世事”的样子,于是不得不觍着脸厚着皮去找老师,恳求他让我去海洋所实习。他给我的第一份差事便是将几个G的图片里的数字输入到excel,我整整输了一个国庆节假日。当时就在到处询问,有没有那种算法可以让自动识别图片里的数字,存入到excel中去,想来,那时的自己也是够拼的。 如今这个自动识别数字的算法算是写出来了

2017-07-30 17:16:04 1899

原创 支持向量机(SVM)

svmMLiA.py,为没有用启发式算法,随机选择alphas[i],alphas[j]的SMO算法的实现。 svmQuicken.py,为启用了启发是算法选择alphas[i],alphas[j]的SMO算法的实现。 代码写的有点乱,结果出来之前,没心思整理代码,结果出来后,就更没心思整理代码了。 (以下正确率的结果,都是由训练数据获得超平面之后,再拿训练数据去测试的。没有专门去整理测试数据

2017-07-15 14:04:20 602 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除